Anda di halaman 1dari 16

Statistica degli estremi

Richiami di probabilit e statistica


Il calcolo della probabilit di un evento direttamente connesso con: - la CONOSCENZA INCOMPLETA dellevento stesso; - lassunzione di un RISCHIO, calcolato come la probabilit che un evento accada. Esistono due modi fondamentali di utilizzare la teoria della probabilit applicata alla predizione di eventi: - la via PROBABILISTICA, ossia il derivare le propriet probabilistiche di un processo per via assiomatica; - la via STATISTICA, ossia il derivare le propriet probabilistiche di un processo dallanalisi del campione. Diciamo CDF (FUNZIONE CUMULATIVA DI PROBABILIT) la funzione adimensionale, che prende valori compresi tra 0 e 1, definita come: FX ( x ) = P ( X x ) dove P ( X x ) sta per probabilit che X sia minore o uguale a x

X detta variabile aleatoria xi per i = 1,..., n il campione di n misure Diciamo poi PDF (DENSIT DI PROBABILIT) la funzione: F ( x + x ) FX ( x ) dF f X ( x ) = X = lim X x dx x 0 Supponendo di conoscere la probabilit del verificarsi di un evento A , la struttura di probabilit pu cambiare se consideriamo un evento B che condizioni levento A : parleremo in tal caso di PROBABILIT CONDIZIONATA ed abbiamo: P ( A B) P ( A | B) = P ( B) Nel solo caso in cui i due eventi siano indipendenti abbiamo: P ( A | B ) = P ( A)
Dato uno spazio di probabilit S = Bi dove B1 ,..., Bn una partizione di S tale che
i =1 n

Bi B j = per Bi B j , abbiamo il TEOREMA DELLA PROBABILIT TOTALE:

P ( A ) = P ( A Bi ) = P ( A | Bi ) P ( Bi )
i =1 i =1

Paolo Martinis - madchild.it

Statistica degli estremi - 1

Sempre nelle stesse ipotesi, abbiamo anche il TEOREMA DI BAYES: P ( A | Bi ) P ( Bi ) P ( Bi | A ) = n P ( A | Bj ) P ( Bj )


j =1

importante per quanto riguarda il calcolo della probabilit A POSTERIORI: si gi ottenuto un certo risultato per A e si calcola la probabilit che esso derivi da una certa configurazione tra quelle possibili. Un altro importante teorema quello del LIMITE CENTRALE: supponiamo di avere una collezione di variabili aleatorie X i e cerchiamo una variabile Y = X i ; possiamo allora dire che, se N f X i ( x ) , allora la fY ( y ) segue una distribuzione gaussiana. Allo stesso modo, ipotizzando un modello moltiplicativo Y = X i , possiamo dire che se N
N i =1 i =1 n

f X i ( x ) , allora la fY ( y ) segue una distribuzione log-normale, poich


ln Y = ln X i
i =1 N

Distribuzioni comunemente utilizzate


Le funzioni di probabilit discrete pi utilizzate nello studio delle piene sono: la distribuzione di BERNOULLI, che calcola la probabilit delle alternative di successo (0) o insuccesso (1) ed definita come: P (1) = p e quindi come: P ( 0) = 1 p la distribuzione BINOMIALE, che calcola la probabilit di avere m successi in un esperimento dato da una successione di n tentativi: n nm P ( m ) = p m (1 p ) m la distribuzione GEOMETRICA, utile per calcolare il tempo di attesa per il primo successo e definita come:
P (W ) = (1 p )
W 1

con media E ( m ) = np e varianza 2 ( m ) = np (1 p ) ;

dove W il tempo di attesa per il primo successo 1 1 p con media E (W ) = e varianza 2 (W ) = 2 ; p p la distribuzione di POISSON, definita a partire dalla distribuzione geometrica come: exp ( ) P ( m) = m m! dove m il numero dei successi = pn lintensit del successo n il numero dei tentativi

Paolo Martinis - madchild.it

Statistica degli estremi - 2

con media E (W ) = e varianza 2 (W ) = ; tale distribuzione parte dalla considerazione che, quando il numero dei tentativi diventa molto grande ( n ) la probabilit che si verifichi il singolo evento tende a 0; Le funzioni di probabilit continue pi utilizzate sono invece: la distribuzione NORMALE o di GAUSS, definita come: 1 x x 2 1 fX ( x) = exp 2 x 2 la distribuzione LOG-NORMALE, che consiste in una distribuzione normale dove la variabile y = ln x ; la distribuzione ESPONENZIALE, utile per il calcolo del tempo di attesa del primo successo, definita come: t FT1 ( t ) = P (T1 t ) = 1 exp w con valore medio E ( t ) = w ;

la distribuzione GAMMA INCOMPLETA o TERZA DI PEARSON, utile per il calcolo del tempo di attesa del k esimo successo, definita come:
1 t fTk ( t ) = ( k 1) ! FTk ( t ) = fTk ( )d
t
k 1

t exp

con media E ( t ) = k e varianza 2 ( t ) = 2 k . Va fatta una importante osservazione per quanto riguarda questultima distribuzione: essa ha la stessa forma dellidrogramma unitario di Nash. LIUH, infatti, che ha spiegazione fisica come efflusso, pu essere interpretato come la probabilit che una particella, precipitata allistante iniziale in un punto qualsiasi del bacino, attraversi la sezione di chiusura al tempo t . Va inoltre ricordato che il calcolo dei fattoriali pu essere effettuato mediante la funzione gamma completa: per k ( k 1)! ( k ) = k 1 u exp ( u ) dt per k 0

Distribuzioni EV
Una tipologia di distribuzioni statistiche di grande interesse per lanalisi di fenomeni rari come le piene sono le distribuzioni del VALORE ESTREMO o EV (extreme value), studiate prevalentemente da Gumbel. Consideriamo un orizzonte temporale, ovvero un numero di tentativi, sufficientemente grande da permettere la ricerca di un valore massimo dei risultati sui tentativi. Ad esempio cerchiamo la massima tra le piogge in unora allinterno di un orizzonte temporale di un anno. Tale massimo raro Z max sar una variabile aleatoria che pu seguire 3 distribuzioni asintotiche: la distribuzione di Gumbel o EV1;
Paolo Martinis - madchild.it Statistica degli estremi - 3

la distribuzione di Frchet o EV2; la distribuzione di Weibull o EV3. La distribuzione di Gumbel definita come: FZmax ( z ) = exp ( exp ( z ) )
con media E ( z ) = 0.5772 pari al numero di Eulero e varianza 2 ( z ) =

2
6

Presentazione dei dati statistici


Dati i risultati xi per i = 1,..., n di una sequenza di esperimenti casuali tra loro indipendenti, costruiamo la CDF mediante le operazioni: 1. ordinamento degli xi in ordine crescente ( X i = min ( xi ) , X n = max ( xi ) , ecc); 2. assegnazione della frequenza assoluta di superamento ( Fass = i ); 3. assegnazione della frequenza relativa di superamento i - secondo la formula F = ; n i 1 ; - secondo la formula di Hazen F = n i - secondo la formula di Weibull F = ; n +1 4. adattamento (fitting) di una distribuzione teorica alla frequenza empirica.

Stima dei parametri


Il problema dellapplicazione di distribuzioni di probabilit a campioni statistici finiti superato dallo stabilire una relazione tra le variabili standardizzate z e le variabili osservate x , generalmente nella forma: x = az + b Nel caso della distribuzione di Gumbel, ad esempio, otteniamo la distribuzione: x b FX ( x ) = exp exp a

1 xb x b f X ( x ) = exp exp exp b a a I parametri a e b non sono noti a priori, e bisogna quindi procedere mediante alcuni metodi di stima delle distribuzioni. I tre metodi proposti nel seguito danno luogo a tre risultati differenti, ma non si pu affermare che uno sia pi o meno preciso dellaltro.

Metodo dei momenti


Tale metodo di stima parte dalla considerazione che le distribuzioni di probabilit hanno dei momenti statistici ben definiti, ossia la media
+

x =

xf ( x ) dx ,
X

che rappresenta il baricentro della funzione, e la varianza

x2 =

x f X ( x ) dx ,
2

Paolo Martinis - madchild.it

Statistica degli estremi - 4

che ne rappresenta invece il momento di inerzia centrale. Il metodo di stima consiste: 1. nel calcolare i momenti del campione xi per i = 1,..., N :
1 N xi N i =1 1 N x2 = ( xi x ) 2 N i =1 2. nelluguagliarli ai momenti della distribuzione: x = az + b x = az + b 2 az = x b x = a 2 z2 In tal modo avremo le espressioni: 6 a= x
x=

b = x 0.5572a

Metodo grafico
In tale caso si ipotizza che la relazione tra le variabili standardizzate ed osservate sia lineare. Innanzitutto si definisce, per le frequenze osservate ordinate in ordine crescente, la posizione grafica; ad esempio definiamo quella di WEIBULL come: i Fi = P ( X xi ) N +1 In tal modo abbiamo unespressione per le frequenze osservate pari a: N +1 zi = ln ln . i Grazie alla velocit di elaborazione dei fogli elettronici commerciali, possiamo poi effettuare sulle frequenze una regressione lineare, utilizzando il METODO DEI MINIMI QUADRATI. Con questa procedura la retta interpolatrice risente molto dei valori estremi, che poi sono quelli dinteresse per lanalisi delle piene, ma si ha una grossa variabilit in funzione della variabilit del campione.

Metodo della massima verosimiglianza


Con tale metodo si definisce la FUNZIONE DI VEROSIMIGLIANZA (likelyhood) L ( xi , a, b ) in funzione della distribuzione standardizzata scelta f X ( x, a, b ) come:
L = f X ( xi , a, b ) = f X ( x1 , a, b ) ... f X ( xN , a, b )
i =1 N

I parametri a e b sono poi scelti in modo da massimizzare la funzione di verosimiglianza. Nel caso della distribuzione di Gumbel, potendo affermare che
ln L = ln f X ( x )
i =1 N

cercheremo i valori massimi con le espressioni: N N ln L ( a, b ) x b = Na ( xi b ) + ( x b ) exp i =0 a a i =1 i =1

Paolo Martinis - madchild.it

Statistica degli estremi - 5

N ln L ( a, b ) 1 x b = Na exp i =0 b a i =1 a Semplificando il sistema, possiamo iterare fino alla convergenza lespressione N x xi exp ai a = x i =1N x exp ai i =1 ed inserirla nella 1 N x b = a ln exp i a N i =1

Outliers
Al fine di operare una scelta cosciente del metodo di stima, sul campione va effettuata anche una verifica dellesistenza di valori molto rari, detti outliers, che si discostano in maniera significativa dallandamento medio del campione e che stanno nelle code della distribuzione. Il metodo pi utilizzato per verificare la presenza di outliers nella distribuzione consiste nella verifica della disequazione: max ( xi ) = >3 mediana ( xi ) Un metodo per tener conto della presenza, e quindi della dispersione, di questi valori nella distribuzione di Gumbel quello di aumentare il numero dei parametri, e quindi il numero dei gradi di libert. Con questo passaggio nascono dei problemi per la stima: per quanto riguarda il metodo dei momenti, basta calcolare anche i MOMENTI DI ORDINE MAGGIORE AL II della distribuzione ed eguagliarli a quelli del campione: il coefficiente di asimmetria (momento del III ordine);
+

il momento centrale del IV ordine m4 =

(x x)

f X ( x ) dx , che d origine al
m4

coefficiente di appiattimento di Kurtosis1 pari a

x4

Statistiche regionali
Con il crescere dei parametri cala per la loro affidabilit, in quanto i parametri in aggiunta ai primi due momenti hanno una grande varianza di stima. In altre parole il significato del valore trovato molto povero: cambiando il campione, otteniamo infatti valori molto diversi per i parametri. Un metodo per superare questo problema quello di considerare le propriet congiunte, ossia di passare dalle statistiche sulle stazioni indipendenti alle STATISTICHE REGIONALI, combinando le osservazioni di diverse stazioni di misura. In tal modo si ottengono campioni pi numerosi e le stime dei parametri relativi ai momenti maggiori del II diventano pi attendibili. Mettendo insieme i dati delle stazioni regionali possiamo cos ottenere anche una statistica degli outliers:
Per la distribuzione di Gauss abbiamo asimmetria nulla e coefficiente di appiattimento pari a 3; per un coefficiente minore di 3 le distribuzioni sono meno disperse (pi appuntite) al centro, per un coefficiente maggiore di 3 le distribuzioni sono pi disperse (pi appiattite) al centro.
1

Paolo Martinis - madchild.it

Statistica degli estremi - 6

xlocali xlocale e costruire cos delle curve di crescita regionale su di un grafico di Gumbel: effettuiamo in questo modo il Flood Study Report.

reg =

TCEV
Lapproccio italiano del Flood Study Report consiste nel metodo TCEV (two components extreme value). Ipotizziamo che la distribuzione di probabilit derivi dallaccoppiamento di 2 distribuzioni di Gumbel: x b1 una F1 = exp exp relativa agli eventi ordinari; a1 x b2 una F2 = exp exp relativa ad eventi estremi ed eccezionali. a2 Ipotizziamo un rapporto di miscelazione che indichi quanto i fenomeni legati ad F2 sono pi rari rispetto a quelli legati ad F1 :

F = (1 ) F1 + F2

con 0 1

In tal modo abbiamo, per la distribuzione, i 5 parametri a1 , b1 , a2 , b2 e . Questo tipo di distribuzione stata testata dal GNDCI (gruppo nazionale per la difesa dalle catastrofi idrogeologiche) relativamente ai soli dati di pioggia. Ovviamente il peso del rapporto deve essere commisurato al rischio che si associa allevento raro, ed in particolare al tempo di ritorno dellevento eccezionale in relazione allimportanza dellopera che si sta progettando.

Test statistici
Dopo aver stimato una funzione di probabilit che adatti la distribuzione di una variabile aleatoria campionaria, possiamo eseguire un test per verificare se ladattamento accettabile o meno. Il test parte dalle considerazioni: - i parametri a e b vengono stimati, quindi hanno una certa variabilit e possono cos essere interpretati come variabili aleatorie; - sotto particolari ipotesi, possiamo ritenere nota la distribuzione di probabilit di tali parametri; - in funzione dei parametri possibile valutare la STATISTICA DEL TEST, ossia una misura, determinata mediante opportune regole di calcolo, del grado di veridicit di una certa IPOTESI INIZIALE H0; nel nostro caso la statistica fondamentalmente la differenza tra la distribuzione del campione e la distribuzione teorica adottata; - in base alle distribuzioni osservate e adottate, e alla misura della statistica calcolata, possiamo fissare un CRITERIO DI CONFRONTO, ossia un limite di rigetto per i valori della statistica, superato il quale lipotesi iniziale non verificata; Al di fuori delle fasce di confidenza, delimitate dai limiti di rigetto, comunque presente una probabilit residua che lipotesi iniziale sia verificata: diciamo ERRORE DEL PRIMO TIPO la probabilit di rigettare H0 quando vera. Ovviamente tale errore sar sempre presente, ma va mantenuto il pi basso possibile. Allo stesso modo avremo una certa probabilit di accettare H0 anche quando falsa, che chiameremo ERRORE DEL SECONDO
Paolo Martinis - madchild.it Statistica degli estremi - 7

Come facile osservare dalla figura, al crescere di si assiste al calare di , e viceversa. La sequenza logica nella produzione di un test quindi la seguente: 1. si identifica unipotesi H0; 2. si definisce una statistica, tipica del test; 3. si definisce un criterio di rigetto C ; 4. si sceglie un livello di errore del primo tipo; 5. si determina il valore di C in funzione di ; 6. si calcola la statistica P = P ( x1 ,..., xN ) . 7. si controlla che lipotesi iniziale sia verificata.

TIPO.

Test del 2
Lipotesi H0 del test che le frequenze osservate coincidono con quelle teoriche. La prima operazione quella di dividere lasse delle variabili aleatorie x in M classi mediante M 1 punti di estremo C1 , C2 ,..., CM 1 , tali che per la prima classe avremo x < C1 , per la seconda classe avremo C1 < x < C2 , eccetera. I valori X 1 ,..., X N del campione si disporranno liberamente allinterno delle classi appena definite, ed otteniamo cos una FREQUENZA OSSERVATA Oi per i = 1,..., M , ossia il numero di elementi del campione che ricadono in una certa classe. Supponendo nota la PDF, possiamo dire che larea sottostante tale curva e delimitata dalle linee di classe x = Ci 1 e x = Ci rappresenta la probabilit che un generico valore x sia compreso tra Ci 1 e Ci . Moltiplicando poi questa probabilit per N , otteniamo la FREQUENZA TEORICA Ei , ossia il numero atteso di uscite allinterno della singola classe. Va osservato che, affinch il test funzioni, il numero atteso in ciascuna classe deve essere maggiore o uguale a 5, e dobbiamo quindi disporre di un campione di almeno 20 elementi. La statistica da calcolare poi:
Ei Quando lipotesi di base H0 verificata, ossia quando le frequenze osservate sono abbastanza simili alle frequenze teoriche, allora la statistica C2 segue la distribuzione 2 ( ) , funzione dei gradi di libert del sistema:
i =1

C2 =

( Oi Ei )

= M 1 P dove P il numero di parametri della PDF2 Prima di calcolare la statistica va definito il livello di errore del primo tipo, che generalmente vale 0.01, 0.05 o 0.10: considerando ad esempio = 0.05 possiamo definire il valore critico 2 crit = 2 ( P ( 0.95 ) , )
2 Quando C 2 < crit accettiamo lipotesi di base, e quindi la distribuzione adottata
2 rappresentativa del campione; se invece C 2 > crit non possiamo accettare lipotesi di base. Essendo i valori tutti positivi, il test sar ad una coda.

Nel caso della distribuzione di Gumbel, P=2. Statistica degli estremi - 8

Paolo Martinis - madchild.it

Test di Kolmogorov-Smirnov
Lipotesi di questo test identica a quella del test 2, ossia che le frequenze osservate coincidono con quelle teoriche. La prima operazione da compiere la definizione di una frequenza di campionamento i FE ( i ) = N dove i lordine (crescente) dellelemento campionario Definiamo poi la funzione D ( x ) = F x, a , b F
X

ossia la differenza, in ogni singolo punto x , tra il valore della frequenza di campionamento e la CDF adottata. La statistica del test sar: DN = max D ( x )
x

dove D = D ( N ) una distribuzione molto complessa, rintracciabile unicamente su testi specialistici. I valori di D per i piccoli campioni sono tabellati; per campioni con N 35 40 possiamo invece assumere i valori approssimati: 1.22 1.36 1.63 D0.10 = , D0.05 = , D0.01 = N N N Un metodo molto veloce di eseguire il test quello per via grafica: definiamo il range [ FX D ; FX + D ] attorno alla funzione di probabilit, ignorando i valori maggiori di 1 e minori di 0, e valutiamo se tutti i valori delle frequenze osservate cadono allinterno del range; se cos non fosse, il test non sarebbe soddisfatto.

Osservando che il massimo deve necessariamente cadere in corrispondenza dei valori campionari, la statistica viene ad essere: i i 1 DN = max FX xi , a, b FX xi 1 , a, b i N N Anche questo test ad una coda, in quanto la statistica il massimo di valori assoluti, e quindi il massimo di valori tutti positivi. Il criterio di rigetto dato dalla condizione DN > D

Paolo Martinis - madchild.it

Statistica degli estremi - 9

Applicazioni statistiche dellidrologia


Lutilizzo di elaborazioni statistiche sui dati idrologici di piena importante: - in fase di VALUTAZIONE DEL RISCHIO IDROLOGICO; - in fase di PROGETTAZIONE DEI SERBATOI ARTIFICIALI; - in fase di PROGETTAZIONE DELLE OPERE DI PROTEZIONE IDRAULICA. In riferimento a quanto detto sopra, i valori idrologici che ci interessa maggiormente ricavare sono: la PORTATA AL COLMO della piena Qcolmo , dalla quale possiamo ad esempio ricavare la quota di sicurezza dellargine; il VOLUME DI PIENA V piena in base al quale possiamo, ad esempio, dimensionare i serbatoi artificiali. Quando parliamo di campione di eventi idrologici, ci riferiamo sostanzialmente al considerare le portate di piena o le misure di pioggia come variabili aleatorie. Non conoscendo deterministicamente il meccanismo di produzione delle piene, i valori Qcolmo e V piena sono ottenibili a partire da uninferenza statistica, ossia una stima della distribuzione di probabilit che meglio approssima levento osservato. Linferenza, infatti, pu essere - diretta sulle osservazioni di portata di piena; - indiretta, ossia con la distribuzione delle portate di piena ricavate dallinferenza sui dati di pioggia mediante lapplicazione di un modello geomorfologico. A seconda dei dati disponibili sulle portate di piena, ossia delle dimensioni del campione di portate, si adottano infatti approcci diversi: quando non sono presenti dati, oppure i dati sono relativi a pochi anni, necessario costruire una trasformazione afflussi-deflussi; quando abbiamo dati relativi ad un periodo di osservazione di almeno 10 anni, possiamo invece effettuare unanalisi statistica delle portate di piena osservate.

Criteri di campionamento dei dati di portata


Esistono fondamentalmente tre metodi per effettuare il campionamento dei dati idrologici: possiamo effettuare un campionamento delle diverse portate di PICCO, ossia i valori massimi di portata tra i quali sia visibile la curva di decadimento delle sorgenti; possiamo fissare un valore di SOGLIA e considerare il massimo valore di portata per ogni intervallo che superi tale soglia, cos da considerare gli eventi come indipendenti: otterremo in tal modo la serie POT (Peaks Over Threshold); tale serie solitamente consigliata quando avessimo a disposizione dati relativi ad un decennio, in quanto solitamente si ha una media di 8-10 eventi di piena allanno; possiamo considerare il PICCO MASSIMO Qma in un periodo annuale3, ottenendo in questo modo la serie MAF (Maximum Annual Flood); tale serie solitamente adoperata quando si hanno dati relativi a pi di 20 anni.

Utilizziamo il periodo annuale al fine di mantenere la stazionariet del processo: in senso stretto la struttura di probabilit risulta essere sempre la stessa, in senso debole si ha una stazionariet di media e varianza.
3

Paolo Martinis - madchild.it

Statistica degli estremi - 10

A seconda che si effettui il campionamento secondo una o laltra serie, si adottano solitamente strutture di probabilit diverse: per la serie POT useremo una distribuzione esponenziale, mentre per la serie MAF utilizzeremo una distribuzione di Gumbel. Fissiamo lattenzione su questultimo caso: la probabilit di NON SUPERAMENTO, ossia la probabilit che la portata al colmo massima annuale superi un certo valore q , sar data dalla funzione Q b FX ( x ) = P ( Qma q ) = exp exp ma , a mentre la probabilit di superamento, ovvero la probabilit che la portata al colmo massima annuale superi tale valore, sar ovviamente data dalla funzione F1 ( x ) = P ( Qma q ) = 1 FX ( x ) Definiamo il TEMPO DI RITORNO come il valore medio4 di attesa tra due superamenti successivi: 1 1 TR = = F1 1 FX Va notato che il concetto di tempo di ritorno puramente statistico, in quanto valor medio; nella realt non detto che una piena eccezionale ritorni esattamente dopo TR anni. Cos, sempre considerando un periodo di riferimento annuale, la probabilit che la portata massima annua superi il valore q data da: 1 P ( Qma > q ) = TR mentre la probabilit del non superamento 1 P ( Qma > q ) = 1 TR Considerando invece un periodo di riferimento di m anni, invece, la probabilit di non superamento data dalla

1 P ( Qma > q ) = 1 TR Quando poi avessimo m = TR la probabilit di non superamento viene ad essere 1 1 P ( Qma > q ) = 1 e TR Poich e = 2.71 3 , su TR anni avremo: - circa un terzo di probabilit che la portata massima non sia mai superata; - circa un terzo di probabilit che la portata massima sia superata una sola volta; - circa un terzo di probabilit che la portata massima sia superata due o pi volte.
TR

Criteri di campionamento dei dati di pioggia


Per il campionamento delle misure di pioggia ci si riferisce ad altezze cumulate su intervalli di tempo prefissati, in quanto la misura puntuale molto difficile da effettuarsi, come abbiamo gi visto. Solitamente, il campione delle misure di pioggia sar quindi

Il tempo di ritorno viene valutato in anni; dimensionalmente la definizione corretta, in quanto l1 al numeratore lunit di tempo di campionamento, ossia 1 anno.
4

Paolo Martinis - madchild.it

Statistica degli estremi - 11

costituito dalle massime altezze cumulate in 1,3,6,12 e 24 ore5, con un periodo di riferimento di un anno. Ogni serie di misure FHj ( h j ) , relativa ad uno degli intervalli di tempo j = 1hr ,..., 24hr , sar poi approssimata da una distribuzione EV1 di Gumbel: FZj ( z ) = exp( exp( z ))) per < z < +

hj bj . aj Al solito per la stima di a e b possiamo usare i metodi dei momenti, della massima verosimiglianza o dei minimi quadrati. Luso dei dati di pioggia cos campionati ed approssimati pone per unimportante problema: non detto che il parametro di tempo della trasformazione afflussi-deflussi sia uguale ad uno degli intervalli fissati dal Servizio Idrografico Nazionale. Una rete di drenaggio urbana, ad esempio, dimensionata in base alla portata nel collettore, stimata mediante luso del modello della corrivazione lineare sui dati di pioggia. Il tempo di corrivazione del bacino, in generale, non sar esattamente 1,3,6,12 o 24 ore. Sar quindi necessario ricavare una funzione di h e t che ci permetta di ottenere dei valori di ruscellamento per ogni durata di pioggia. Assegnato quindi, anche per le piogge, un tempo di ritorno6, possiamo ricavare la : 1 T h j = b j a j ln ln h j = b j a j ln ln R FH TR 1 In base a queste considerazioni possiamo utilizzare la cosiddetta LSPP (Linea Segnalatrice di Possibilit Pluviometrica) che interpoli gli h j , una linea di potenza per espressione di
con lassunzione z = potenza, ossia una parabola ad asse orizzontale in senso lato, definita come: h ( t ) = at n dove a pari a 0.2 0.3 per la Pianura Padana e 0.5 0.6 per le Alpi n compreso tra 0 e 1 e collegato alla collocazione geografica entrambi i parametri variano in base al tempo di ritorno assegnato A questo punto, sempre in riferimento al modello della corrivazione, facile calcolare la portata t per t < TC j Q = AB r con r = TC j per t TC Al crescere della durata t , abbiamo cos per la portata: - unespressione crescente quando t < TC : A Q = b at n TC - unespressione decrescente quando t TC :
Q = Ab at n 1 La massima portata di picco sar cos Q = Ab aTC n 1
Intervalli fissati dal Servizio Idrografico Nazionale. Valori normalmente usati per il tempo di ritorno: 5 anni per le fognature, 100 anni per i fiumi, 1000 anni per le dighe.
5 6

Paolo Martinis - madchild.it

Statistica degli estremi - 12

Trasformazione afflussi-deflussi
Nel caso della trasformazione afflussi-deflussi, abbiamo i dati di partenza: le piogge FH ( h ) t condizionate ad una certa durata t mediante la funzione LSPP

h (TR , t ) = at n ;
una certa funzione g ( h ) , data dall IUH, che trasforma le piogge in portate; e vogliamo trovare la distribuzione FQ ( q ) . In realt la distribuzione di probabilit delle piogge sarebbe una funzione complessa del tipo FH ,T ( h, t ) , a dominio bidimensionale ( h, t ) e condominio monodimensionale. Adottiamo quindi una convenzione lavorando a t costante, ossia condizionando le piogge 1 che determina la funzione LSPP. alle durate assegnando una frequenza TR : F = 1 TR Al variare di t la funzione g ( h ) fornisce una portata di piena Q ( h, t ) della quale cerco il valore massimo. La particolare durata t * che produce la PORTATA CRITICA Qmax = g ( h*, t *) viene detta DURATA CRITICA, mentre la coppia h* = a ( t *) , t * viene detta EVENTO CRITICO.
n

Secondo consuetudine assumiamo lo stesso tempo di ritorno TR sia per la portata critica che per le piogge, nonostante nella realt il tempo di ritorno delle portate sia minore di quello delle piogge, e quindi il rischio aumenti con tale assunzione. Valutiamo ora le espressioni per la durata critica a seconda che si utilizzi uno o laltro modello di IUH. Per quanto riguarda il modello della corrivazione, abbiamo gi visto che la durata critica coincide con il tempo di corrivazione del bacino.

Invaso
Per quanto riguarda invece il modello dellinvaso, partiamo da un IUH del tipo 1 t IUH = exp k k La portata di picco sar cos determinata dallespressione h t QP = Q ( t ) = Ab 1 exp = Ab at n 1 ( t ) t k t dove ( t ) = 1 exp detto fattore di riduzione della piena k Visto che Ab a un prodotto tra costanti, possiamo cercare il massimo come:

t max ( QP ) = max t n 1 ( t ) = max t n 1 1 exp t t t k t 1 Moltiplicando poi per la costante n1 e ponendo c = crit il massimo diventa: k k n 1 t t max 1 exp = max c n 1 1 exp ( c ) = max F ( c ) t t t k k Poniamo quindi uguale a zero la derivata prima della funzione: dF ( c ) = ( n 1) c n 2 (1 e c ) + c n 1e c = 0 dc

Paolo Martinis - madchild.it

Statistica degli estremi - 13

( n 1) (1 e c ) + ce c = 0 ce c = ( n 1) (1 e c )
Vista la difficolt di risolvere questultima equazione, e visto che lespressione ce c n = 1 1 e c d luogo al grafico univocamente determinato di figura, possiamo ricavare c a partire da n e calcolare poi la durata critica mediante lespressione: tcrit = ck

n
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

Nash
Per quanto riguarda il modello di Nash possiamo condurre lo stesso ragionamento svolto per il modello dellinvaso. Partiamo da unespressione per lidrogramma unitario istantaneo
exp k e cerchiamo una durata di pioggia t tale che d = (1 n ) dt t dove larea pari a
1 u ( ) = k ( ) k
1

= max
'

'+t '

u ( ) d

Il problema si riduce quindi sostanzialmente al calcolo dellarea ( ) , difficile poich dobbiamo calcolarne il massimo sugli estremi dintegrazione.
Data una generica funzione f ( x ) , dovendo calcolare
x +t

lintegrale =

f ( ) d , possiamo cercare la che

annulla la derivata prima rispetto alla x . Sappiamo che per un incremento x + dx abbiamo un incremento d = f ( x + t ) dx f ( x ) dx , e quindi

d dx

= f ( x + t ) f ( x) = 0 .

Nel caso di > 1 7, quindi, cerchiamo una ' tale che u ( '+ t ) = u ( ) In tal modo possiamo ricavare: '+ t 1 ' 1 ( '+ t ) exp = ' exp k k ' t ' 1 ( '+ t ) exp exp = ' 1 exp k k k

Per = 1 (IUH dellinvaso) la relazione non vale in quanto la funzione vincolata ed il massimo si trova sul confine del dominio di definizione della funzione.
7

Paolo Martinis - madchild.it

Statistica degli estremi - 14

t exp = ' 1 k dove questultima espressione va risolta per tentativi, almeno quando In generale, quindi, il metodo per trovare la durata critica : 1. fissare una durata t di primo tentativo; 2. calcolare numericamente o analiticamente ' ;

( '+ t )

3. calcolare ( t ) = ' ( '+ t ; , k ) ' ( '; , k ) , dove ' ( x; , k ) = u ( ) d 8;


0

d d = u ( ') = u ( '+ t ) ; in modo analitico, poich dt dt d = (1 n ) soddisfatta; in caso contrario ripetere il 5. verificare se lequazione dt t procedimento scegliendo una durata t di secondo tentativo. Oggigiorno ovviamente possibile far eseguire literazione ad un software, ad esempio ad un foglio di calcolo Excel. Tuttavia utile conoscere il procedimento di scelta delle nuove t , in quanto i metodi di iterazione usati dal software si basano sullo stesso procedimento. Innanzitutto definiamo lo scarto d = (1 n ) dt t Quando > 0 la t va aumentata, mentre quando < 0 la t va diminuita. Ad un certo punto delliterazione, avremo una durata t1 di poco minore del valore cercato, ed una durata t2 di poco maggiore del valore cercato. A questo punto possiamo usare il metodo del valore medio o della bisezione per trovare la durata cercata. Un altro metodo piuttosto usato invece quello di NewtonRaphson, che consiste nel calcolare, per un generico valore x1 , i
4. calcolare la derivata valori f ( x1 ) e f ' ( x1 ) . A partire da questi valori troviamo il punto x2 = x1
f ' ( x1 ) f ( x1 )

, per il

quale calcoliamo ancora il valore della funzione e della derivata prima: literazione si ferma quando f ( xi ) = 0 . Il metodo va molto bene in quanto si ha una convergenza molto rapida, ma pu avere grossi problemi con alcune funzioni.

La funzione gamma incompleta disponibile, nella forma proposta e con i parametri definiti, nel software di calcolo Excel. Statistica degli estremi - 15

Paolo Martinis - madchild.it

Nash secondo Matteo Mainetti


Una strada alternativa per calcolare la durata critica quella di ricavare, anche per Nash, un grafico di n in funzione di c . Nel caso di un modello di Nash con 2 serbatoi abbiamo lespressione: c2 n = 1 c e c 1 Nel caso invece di m serbatoi abbiamo: cm n = 1 m 1 ( m 1)!ec ( m i )!ci ( m 1)! i =1 La durata critica sar sempre: tcrit = ck

Paolo Martinis - madchild.it

Statistica degli estremi - 16

Anda mungkin juga menyukai