Anda di halaman 1dari 115

Universit de Montral

valuation de la modlisation et des prvisions de


la vitesse du vent menant lestimation de la
production dnergie annuelle dune turbine
olienne

par

Janie Coulombe

Dpartement de mathmatiques et de statistique


Facult des arts et des sciences

Mmoire prsent la Facult des tudes suprieures


en vue de lobtention du grade de
Matre s sciences (M.Sc.)
en statistique

avril 2015


c
Janie Coulombe, 2014
Universit de Montral
Facult des tudes suprieures

Ce mmoire intitul

valuation de la modlisation et des prvisions de


la vitesse du vent menant lestimation de la
production dnergie annuelle dune turbine
olienne
prsent par

Janie Coulombe

a t valu par un jury compos des personnes suivantes :

(prsident-rapporteur)

Christian Lger
(directeur de recherche)

(membre du jury)

Mmoire accept le:


v

SOMMAIRE

Suite un stage avec la compagnie Hatch, nous possdons des jeux de don-
nes composs de sries chronologiques de vitesses de vent mesures di-
vers sites dans le monde, sur plusieurs annes. Les ingnieurs oliens de la
compagnie Hatch utilisent ces jeux de donnes conjointement aux banques de
donnes dEnvironnement Canada pour valuer le potentiel olien afin de sa-
voir sil vaut la peine dinstaller des oliennes ces endroits. Depuis quelques
annes, des compagnies offrent des simulations mso-chelle de vitesses de
vent, bases sur divers indices environnementaux de lendroit valuer. Les
ingnieurs oliens veulent savoir sil vaut la peine de payer pour ces donnes
simules, donc si celles-ci peuvent tre utiles lors de lestimation de la produc-
tion dnergie olienne et si elles pourraient tre utilises lors de la prvision
de la vitesse du vent long terme. De plus, comme lon possde des donnes me-
sures de vitesses de vent, lon en profitera pour tester partir de diverses m-
thodes statistiques diffrentes tapes de lestimation de la production dner-
gie. Lon verra les mthodes dextrapolation de la vitesse du vent la hauteur
dune turbine olienne et lon valuera ces mthodes laide de lerreur qua-
dratique moyenne. Aussi, on tudiera la modlisation de la vitesse du vent
par la distribution Weibull et la variation de la distribution de la vitesse dans le
temps. Finalement, lon verra partir de la validation croise et du bootstrap si
lutilisation de donnes mso-chelle est prfrable celle de donnes des sta-
tions de rfrence, en plus de tester un modle o les deux types de donnes
sont utilises pour prdire la vitesse du vent. Nous testerons la mthodologie
globale prsentement utilise par les ingnieurs oliens pour lestimation de la
production dnergie dun point de vue statistique, puis tenterons de proposer
des changements cette mthodologie, qui pourraient amliorer lestimation
de la production dnergie annuelle.
Mots cls : nergie olienne, Modlisation de la vitesse du vent, Distribution
Weibull, Bootstrap par blocs, Extrapolation de la vitesse du vent, Coefficient
de cisaillement du vent.
vii

SUMMARY

Following an internship with the company Hatch, we have access to da-


tasets that are composed of wind speed time series measured at different sites
accross the world and over several years. The wind speed engineers from Hatch
are using these datasets jointly with Environment Canada databases in order to
ascertain the wind energy potential of these sites and to know whether it is
worth installing wind turbines there. For a few years, some companies are also
offering mesoscale simulations of wind speed based on different environmen-
tal characteristics from the site we want to evaluate. We would like to know
if it is worth paying for those mesoscale datasets and if they can be used to
provide better estimations of the wind energy potential. Among other things,
these data could be used to provide a better estimation of the long term mean
wind speed. Since we already possess measured datasets, we will also use
them to test, with statistical methods, the methodology currently used and the
different steps leading to an estimation of the wind energy production. First of
all, we will see what are the different methods that could be used to extrapo-
late wind speed to a wind turbines height and we will evaluate those methods
with the mean squared extrapolation error. Also, we will study wind distri-
bution modelling by the Weibull distribution and consider its variability over
time. Finally, cross-validation and block bootstrap will be used to see whether
we should use mesoscale data instead of wind data from Environment Canada
or whether it would even be beneficial to use both kind of data to predict wind
speed. In summary, the whole methodology used by wind speed engineers to
estimate the energy production will be tested from a statistical point of view
and we will attempt to propose changes in this methodology that could im-
prove the estimation of the wind speed annual energy production.
Keywords : Wind energy, Wind speed modelling, Weibull distribution, Block
bootstrap, Wind speed extrapolation, Wind shear coefficient.
ix

TABLE DES MATIRES

Sommaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . v

Summary . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vii

Liste des figures . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xiii

Liste des tableaux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xv

Remerciements . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

Chapitre 1. tapes menant au calcul du potentiel olien dun endroit


spcifique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

1.1. Collecte des donnes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

1.2. valuation du potentiel olien et prvision de la vitesse du vent


long terme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.2.1. Extrapolation des vitesses de vent . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.2.2. Modlisation de la distribution de la vitesse du vent . . . . . . . . . . 9
1.2.3. Utilisation de la courbe de puissance pour calculer lnergie
estime . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.2.4. valuation de la moyenne du vent long terme . . . . . . . . . . . . . . 10

Chapitre 2. Description du vocabulaire et des jeux de donnes utiliss 11

2.1. Les jeux de donnes disponibles et la notation des variables . . . . . 11


2.1.1. Les donnes collectes par la compagnie . . . . . . . . . . . . . . . . . . . . . . 11
2.1.2. Les donnes simules de type mso-chelle . . . . . . . . . . . . . . . . . . . . 12
2.1.3. Les donnes dune station de rfrence comme celles dEnvironnement
Canada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.1.4. Un exemple de statistiques descriptives pour les trois jeux de
donnes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
x

2.2. Le traitement des donnes manquantes . . . . . . . . . . . . . . . . . . . . . . . . . . 15

2.3. Les divers sites tudis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

Chapitre 3. Extrapolation des vitesses de vent . . . . . . . . . . . . . . . . . . . . . . . . . 17

3.1. La loi de puissance pour modliser le profil du vent . . . . . . . . . . . . . 17


3.1.1. Les mthodes dextrapolation et lestimation du coefficient de
cisaillement . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

3.2. Dtermination de la mthode optimale dextrapolation . . . . . . . . . . 26


3.2.1. Discussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

Chapitre 4. Modlisation de la distribution de la vitesse des vents . . . . . 33

4.1. La loi de Weibull et ses caractristiques . . . . . . . . . . . . . . . . . . . . . . . . . . 34

4.2. Lestimation des paramtres . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

4.3. Vrification de lajustement de la Weibull sur la distribution de la


vitesse des vents . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
4.3.1. Tests dadquation pour la distribution Weibull . . . . . . . . . . . . . . . 37
4.3.1.1. Rsultats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
4.3.1.2. Discussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

4.4. Variation des paramtres de la Weibull en fonction du temps . . . . . 41


4.4.1. Comparaison de la variance des paramtres globaux, annuels
et mensuels . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
4.4.1.1. Rsultats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
4.4.1.2. Discussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
4.4.2. La dpendance entre les observations . . . . . . . . . . . . . . . . . . . . . . . . . 57

4.5. Comparaison du calcul de lnergie estime partir de la distribution


exprimentale et de lajustement de Weibull globale . . . . . . . . . . . . . 60
4.5.1. Rsultats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
4.5.2. Discussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64

4.6. Conclusion sur la modlisation de la vitesse du vent . . . . . . . . . . . . . 64

Chapitre 5. Prvision de la vitesse du vent passe et valuation de la


variabilit de cette prvision . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

5.1. Utilit des prvisions de la vitesse du vent sur des annes passes 67
xi

5.2. La mthode MCP . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67


5.2.1. Dfinition de la mthode . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
5.2.2. Les modles linaires utiliss pour faire les prvisions . . . . . . . . 68
5.3. Validation croise sur les premires annes de donnes disponibles
partir des deux dernires annes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
5.3.1. Les chantillons de validation et dapprentissage . . . . . . . . . . . . . 70
5.3.2. Application de la validation croise . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
5.3.3. Rsultats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
5.3.4. Discussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
5.3.5. Estimation de la moyenne de la vitesse du vent long terme et
erreur relative . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
5.3.6. Discussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
5.4. Calcul de la variabilit des prvisions partir du bootstrap . . . . . . 76
5.4.1. Le bootstrap utilis sur des donnes indpendantes et identiquement
distribues . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
5.4.2. Le bootstrap pour valuer lerreur quadratique moyenne de
prvision partir dune rgression linaire sur des donnes
i.i.d. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
5.4.2.1. Le bootstrap par bloc . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
5.4.2.2. Tailles des blocs derreurs bootstrap . . . . . . . . . . . . . . . . . . . . . . 83
5.4.2.3. Rsultats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
5.4.2.4. Discussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
5.4.2.5. valuation de la variance de la moyenne long terme estime
88
5.4.2.6. Discussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
5.5. Conclusion sur les prvisions de la vitesse du vent . . . . . . . . . . . . . . 92

Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95

Bibliographie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
xiii

LISTE DES FIGURES

1.1 Reprsentation dun mt de mesure classique avec six anmomtres


installs trois hauteurs diffrentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

2.1 Diffrents emplacements des mts de mesure (triangles rouges et


verts) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

3.1 Les quatre mthodes dextrapolation partir dun coefficient de


cisaillement local, au temps i=113501 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
3.2 Les mthodes dextrapolation partir dun coefficient de cisaillement
global, au temps i=113501 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

4.1 Exemples de la fonction de densit dune distribution Weibull pour


divers paramtres . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
4.2 Exemple dajustement de Weibull sur lhistogramme des vitesses du
vent aux dix minutes au site 1, sur neuf ans (k = 2, 423, = 7, 987) . . 37
4.3 Ajustements de lois Weibull pour plusieurs annes, au site 1 . . . . . . . . 42
4.4 Distributions des 1 000 variances chantillonnales annuelles et
mensuelles pour les deux paramtres de Weibull, provenant des
ajustements sur des distributions simules bootstrap partir de
paramtres annuels . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
4.5 Distributions des 1 000 variances chantillonnales annuelles et
mensuelles pour les deux paramtres de Weibull, provenant des
ajustements sur des distributions simules bootstrap partir de
paramtres mensuels . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
4.6 Graphique dautocorrlation de la srie des vitesses de vent moyennes
aux heures, au site 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
4.7 Graphique dautocorrlation de la srie des vitesses de vent moyennes
aux jours, au site 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
xiv

4.8 Courbe de puissance de la turbine olienne E-82 E2 . . . . . . . . . . . . . . . . 61


xv

LISTE DES TABLEAUX

2.1 Statistiques descriptives de la vitesse du vent (m/s) horaire pour les


trois jeux de donnes du site 1 sur une priode de temps commune
(N=72 704) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

3.1 EQME calcule partir des diverses mthodes dextrapolation, pour


les sites 1 30 (2 anmomtres disponibles seulement) . . . . . . . . . . . . . 27

3.2 EQME calcule partir des diverses mthodes dextrapolation, au


site 31 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

3.3 Erreurs relatives (%) entre la vitesse collecte moyenne lanmomtre


1 et les vitesses extrapoles moyennes calcules partir de chaque
mthode, pour les sites 1 30 (2 anmomtres disponibles seulement)
28

3.4 Erreurs relatives (%) entre les vitesses de vent moyennes calcules
partir des diverses mthodes dextrapolation et la vitesse moyenne
lanmomtre 1, au site 31 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

4.1 Rsultats aux tests du Khi-deux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

4.2 Comparaison des diverses mesures de variance du paramtre de


forme k . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

4.3 Comparaison des diverses mesures de variance du paramtre dchelle


. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

4.4 Comparaison des estimations de la production dnergie annuelle


faites partir de la densit Weibull ajuste ou des frquences empiriques
de la distribution des vitesses de vent Weibull annuelles . . . . . . . . . . . . 63

5.1 Racines carres des erreurs quadratiques moyennes de prvision par


validation croise pour chaque site et chaque groupe de prdicteurs
dans la rgression linaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
xvi

5.2 Erreurs relatives (%) entre la vitesse moyenne long terme estime
partir de chacun des trois modles de rgression et la vitesse
moyenne des vitesses de vent mesures lanmomtre 1 . . . . . . . . . . 75
5.3 Diffrence absolue relative (DAR) entre la racine carre de lerreur
quadratique moyenne de prvision sur 1 000 bootstraps et la racine
carre de lerreur quadratique trouve par validation croise, pour
chaque taille de bloc et chaque groupe de prdicteurs dans la
rgression (%) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
5.4 Rapports de la variance de lestimateur de la moyenne bootstrap
par bloc de longueur l par rapport la variance pour un bloc de
longueur 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
1

REMERCIEMENTS

Il sagit dun travail qui ncessite beaucoup de persvrance, que la re-


cherche et la rdaction dun mmoire. Je naurais pas pu terminer sans laide
prcieuse de mes amis et de ma famille. lUniversit, mes amis les plus
proches, Audrey-Anne, Paule Marjolaine et Alexandre, mont supporte du-
rant des mois et mont aussi aide dans les aspects plus techniques de ma
recherche. Je tiens aussi remercier dautres amis trs proches, soient Cathe-
rine, Nomie, Audrey, Pamla, Charlne et Sbastien, qui ont t derrire moi
durant tout le processus et qui demeurent, tout comme les premiers, des amis
incroyables sans qui ce travail naurait probablement pas t possible. Je remer-
cie ma famille pour le grand support dont ils ont fait preuve durant les cinq
dernires annes passes lUniversit. Ils ont eu confiance en moi et mont
fortement encourage tout au long de la route. Je remercie aussi mon supervi-
seur, monsieur Christian Lger, avec qui jai eu le bonheur de travailler et sans
qui plusieurs opportunits ne se seraient pas prsentes moi. Entre autres,
mon implication dans la Socit statistique du Canada, o jai pu participer
diffrents comits, me permet de garder contact avec plusieurs statisticiens au
Canada. Aussi, son aide constante et sa faon daborder les diffrentes ques-
tions mont permis de dvelopper mon sens critique et de me construire un
coffre doutils tous trs utiles pour ma future carrire. Je remercie le Dparte-
ment de mathmatiques et de statistique de lUniversit de Montral, qui ma
offert un envionnement o il fut facile de crer des liens forts avec mes col-
lgues, que je ctoierai encore longtemps parce quils sont devenus des amis,
et o il fut un plaisir dapprendre et dvoluer. Finalement, je tiens remercier
grandement tous les professeurs qui mont enseign les mathmatiques et la
statistique depuis lcole primaire. Je crois fermement que sans lintrt dont
ils ont fait preuve durant mon cheminement, mes choix de carrire auraient
t diffrents, mon plus grand regret. Merci vous tous davoir chang pour
le mieux les dernires annes et davoir ainsi particip avec moi au commen-
cement dune carrire qui, jen suis sre, sera des plus enrichissantes.
INTRODUCTION

Lnergie olienne est produite au moyen dun processus arognrateur


comme la turbine olienne. Il sagit dune tche peu vidente dvaluer le po-
tentiel olien un site particulier afin de savoir sil vaut la peine dy installer
une turbine et de pouvoir convaincre la banque quun prt pour linstallation
de turbines reprsente un bon investissement. En effet, on engage gnrale-
ment des consultants en ingnierie olienne, lesquels iront installer des mts
de mesure lemplacement dsir et analyseront par la suite les donnes de
vitesse et de direction du vent mesures pour en faire ressortir une valua-
tion de la puissance du vent cet endroit. Cependant, le processus tant assez
coteux, des donnes mesures ne sont gnralement disponibles que sur une
courte priode et il devient donc plus difficile dvaluer le potentiel olien
long terme.

Dautre part, divers outils ont t dvelopps dans le pass afin damliorer les
prvisions du vent et du potentiel olien. Entre autres, des donnes simules
de type "mso-chelle" sont maintenant disponibles par lentremise de compa-
gnies spcialises qui utilisent des donnes environnementales, par exemple
lhumidit relative de lair ou le relief du site, pour simuler des vitesses de
vent horaires lendroit dsir. Ces mthodes ont, en quelque sorte, fait leur
preuve et sont maintenant utilises par les ingnieurs oliens dans divers pro-
jets. Par contre, on ne retrouve pas dans la littrature de validation exhaus-
tive de ces donnes simules permettant de tester lutilit des donnes "mso-
chelle" dans lvaluation du potentiel olien.

Dans le cadre de ce mmoire, on travaillera avec des donnes fournies par


la compagnie Hatch, une compagnie dingnierie qui possde une quipe com-
plte ddie lanalyse de donnes de vent et dinstallation de mts de mesure.
Grce au programme de stage MITACS, qui a permis le financement dune par-
tie de mon stage chez Hatch durant lt 2012, jai pu complter quatre mois de
recherche sur ces donnes. Les donnes mont t fournies pour quelques 31
4

sites dans le monde, situs sur les continents de lAmrique du Nord, du Sud
et de lAfrique. Pour ces sites, des donnes de vitesse du vent et de direction
du vent mesures sur des mts de mesure sont disponibles pour des priodes
variant de deux neuf ans, aux dix minutes. De plus, nous possdons des jeux
de donnes simules horaires de type "mso-chelle" pour tous ces sites, sur
dix ans. Ces donnes sont elles aussi composes de la vitesse du vent et de la
direction sur une base horaire. Nous possdons aussi une troisime source de
donnes pour 15 des sites, soient des donnes collectes aux mts de mesure
de stations de rfrence (comme Environnement Canada, par exemple, qui col-
lecte plusieurs donnes environnementales).

Nous utiliserons donc les donnes disponibles afin de rpondre certaines


questions de recherche.

Dans le chapitre 1, nous discuterons dabord du lien entre les vitesses de vent
mesures aux mts de mesure et le calcul de la production estime dnergie
annuelle. On verra les diverses tapes qui mnent au calcul du potentiel o-
lien, partir de la collecte des donnes. On discutera aussi de lutilisation des
courbes de puissance de turbines oliennes.

Dans le chapitre 2, nous dcrirons les divers jeux de donnes ainsi que les no-
tations utilises dans le mmoire. Nous prsenterons aussi une carte des divers
emplacements pour lesquels des donnes sont disponibles.

Au chapitre 3, le calcul de lerreur quadratique moyenne dextrapolation per-


mettra dvaluer lerreur due lextrapolation des vitesses de vent une hau-
teur quivalente celle des turbines oliennes. On reverra entre autres les rai-
sons qui nous poussent vouloir calculer cette erreur. De plus, diverses m-
thodes dextrapolation seront compares.

Au chapitre 4, on discutera de la modlisation de la vitesse du vent. On verra


en quoi ltape de la modlisation de la distribution des vitesses du vent peut
influencer lestimation de la production dnergie annuelle. Plusieurs tests se-
ront entrepris afin dvaluer la variabilit des distributions de vent annuelles
et mensuelles, pour dterminer sil serait utile de modliser les vents de faon
spare dans le temps plutt que globalement sur plusieurs annes.

On tudiera au chapitre 5 la prvision de la vitesse du vent dans le pass


partir de validation croise. On valuera dans ce chapitre lutilit des donnes
5

"mso-chelle" pour amliorer les prvisions. Le bootstrap sera quant lui uti-
lis et pemettra de tenir compte de la structure de dpendance entre les don-
nes, laquelle nest pas considre dans les autres chapitres. Il permettra aussi
de calculer lerreur de prvision de la vitesse du vent lorsque des donnes me-
sures sont disponibles sur une trop courte priode pour utiliser la validation
croise.

Finalement, on rappellera dans la conclusion les questions de recherche et les


rsultats importants. On considrera aussi dautres avenues qui pourraient
ventuellement tre empruntes.
Chapitre 1

TAPES MENANT AU CALCUL DU POTENTIEL


OLIEN DUN ENDROIT SPCIFIQUE

Une mthodologie prcise est prsentement utilise par les ingnieurs o-


liens afin dobtenir une estimation de la production dnergie annuelle. Pour
obtenir cette estimation, des donnes de vitesse et de direction du vent sont
dabord collectes par des anmomtres et des girouettes. Ces instruments sont
installs des mts de mesure, plants aux endroits o lon voudrait prdire
le potentiel olien. Les ingnieurs enregistrent et comptabilisent ces mesures
durant une certaine priode, dpendant du budget et du temps allou par les
investigateurs. Ce sont ces derniers qui dsirent connatre la valeur dun site
en terme dnergie olienne.

1.1. C OLLECTE DES DONNES


Il est bien important, pour la suite des choses, de comprendre la configura-
tion des anmomtres et des girouettes qui sont installs sur les mts de me-
sure de la compagnie. En effet, divers anmomtres sont installs sur ces mts,
gnralement disposs trois hauteurs diffrentes et doubls de chaque cot
du mt. Notez que nous nutiliserons que les anmomtres dun ct du mt
dans ce mmoire. Cest partir des mesures prises aux trois hauteurs diff-
rentes quon peut tenter, par diverses mthodes dextrapolation, dvaluer la
vitesse du vent une hauteur plus leve dans le but de dterminer quelle
serait la vitesse du vent quivalente la hauteur dune turbine olienne (g-
nralement installe beaucoup plus haut que les anmomtres sur les mts de
mesure). Pour les analyses qui ne touchent pas lextrapolation de la vitesse
du vent, nous utilisons tout au long du mmoire les donnes collectes lan-
momtre 1, qui est le plus haut sur le mt et dont on possde gnralement
plus de donnes sur la priode disponible (moins de donnes manquantes).
8

Pour la section touchant lextrapolation des donnes, nous utilisons les don-
nes collectes aux anmomtres 1, 2 et 3. Ceux-ci sont situs du mme cot du
mt trois hauteurs diffrentes, lanmomtre 2 tant sous lanmomtre 1 et
lanmomtre 3 tant au plus bas, sous lanmomtre 2. Comme le mt de me-
sure du site 31 possde des anmomtres installs quatre hauteurs diffrentes
(lanmomtre 4 tant situ sous lanmomtre 3 dans ce cas, comparativement
au cas o lanmomtre 4 est de lautre cot du mt comme la figure 1.1),
celui-ci fera exception lors des tests sur lextrapolation, dans le chapitre 3. La
figure suivante montre, pour les trente premiers sites, la disposition des an-
momtres sur le mt de mesure et donne une ide de la diffrence dhauteur
entre un mt de mesure et une turbine olienne.

F IGURE 1.1. Reprsentation dun mt de mesure classique avec


six anmomtres installs trois hauteurs diffrentes
9

1.2. VALUATION DU POTENTIEL OLIEN ET PRVISION DE LA VI -


TESSE DU VENT LONG TERME

Nous prsentons maintenant certaines des tapes menant lestimation de


la production dnergie pour valuer le potentiel dun certain site.

1.2.1. Extrapolation des vitesses de vent

Cette tape consiste extrapoler la vitesse du vent une hauteur quiva-


lente celle o lon installerait une turbine olienne. En effet, les donnes de
vitesse du vent utilises sont gnralement celles de lanmomtre 1, qui est
le plus haut sur le mt de mesure. Or, cet anmomtre peut tre install une
hauteur de 40 mtres, par exemple, alors quon installerait plutt une turbine
80 ou 100 mtres. Si lon dsire valuer la puissance qui rsulterait dune telle
turbine, on doit donc valuer la vitesse du vent la hauteur de la turbine. On
utilisera ainsi, dans le chapitre 3, le calcul de lerreur quadratique moyenne
dextrapolation afin de dterminer les diffrences dans lerreur pour diverses
mthodes dextrapolation.

1.2.2. Modlisation de la distribution de la vitesse du vent

On dsire modliser la distribution de la vitesse du vent de faon param-


trique, par exemple, afin de pouvoir rsumer cette distribution par quelques
paramtres seulement. De plus, ces paramtres sont utiliss par les ingnieurs
oliens dans le calcul du potentiel olien dun site. En effet, la fonction de den-
sit relie ces paramtres et la loi utilise pour modliser les vents est uti-
lise conjointement la courbe de puissance dune turbine olienne pour faire
le calcul de lestimation de la production dnergie annuelle en kW un site
particulier.

1.2.3. Utilisation de la courbe de puissance pour calculer lnergie esti-


me

La courbe de puissance dune turbine olienne reprsente la puissance en


kilowatts produite par une turbine olienne, selon la vitesse du vent (en m-
tres/seconde) entrant dans la turbine. Aussitt que nous avons une estimation
des probabilits que la vitesse du vent un site soit dans chaque catgorie
de vitesse du vent (0-1 m/s, 1-2 m/s, etc.) faite partir de notre modlisation
de la distribution des vitesses du vent et que nous avons une ide de la puis-
sance cre partir de chacune de ces catgories de vitesse de vent, grce
10

la courbe de puissance, il nous est possible de calculer lestimation de la pro-


duction dnergie annuelle pour un certain modle de turbine olienne un
certain site. On verra plus en dtails le calcul de la production dnergie dans
le chapitre 4, o lon discutera entre autres de la modlisation de la vitesse du
vent.
1.2.4. valuation de la moyenne du vent long terme

Il est utile, pour les investigateurs dun site, davoir une estimation de la
production dnergie olienne annuelle cet endroit mais il leur faut aussi
connatre la tendance long terme de la vitesse du vent puisque lanne me-
sure nest pas ncessairement reprsentative de la tendance long terme.
Ainsi, des prvisions de la vitesse du vent dans le pass et lestimation dune
moyenne de la vitesse du vent long terme leur permet de garantir, en quelque
sorte, la banque quil vaut la peine dinstaller une turbine olienne un cer-
tain endroit. Voil pourquoi on tentera, dans le chapitre 5, dvaluer lerreur de
prvision de la vitesse du vent long terme partir de la validation croise et
du bootstrap, ce dernier tenant compte de la dpendance entre les vitesses de
vent mesures et permettant dvaluer lerreur de prvision lorsquon possde
trop peu de donnes pour faire une validation croise.
Chapitre 2

DESCRIPTION DU VOCABULAIRE ET DES JEUX


DE DONNES UTILISS

La vitesse du vent tant trs variable dans le temps, lindustrie olienne


doit se baser sur diverses mthodes afin de prvoir les productions futures
dnergie et dobtenir une valuation de lnergie long terme. Pour ce faire,
lon se basera parfois sur dautres jeux de donnes que celles vritablement
collectes par des anmomtres, donnes qui sont disponibles sur une plus
longue priode, afin de prvoir la tendance sur le long terme des donnes de
vitesse de vent.

Dans ce mmoire, on se concentre sur trois types de jeux de donnes qui sont
disponibles pour lanalyse statistique, que lon prsente maintenant.

2.1. L ES JEUX DE DONNES DISPONIBLES ET LA NOTATION DES


VARIABLES

2.1.1. Les donnes collectes par la compagnie

Afin dtudier les prdictions du vent et du potentiel olien, des donnes


collectes diffrents mts de mesure dans le monde ont t fournies par la
compagnie Hatch. Les donnes collectes sont constitues de la vitesse du vent
en mtres/seconde et de la direction du vent en degrs. ll sagit de la pre-
mire source dinformation concernant le potentiel olien un endroit dans le
monde, et, des divers jeux de donnes disponibles, srement la mesure la plus
fiable, puisquaucune altration ny a t porte et que la mesure est prise au
site exact o lon dsire obtenir une valuation du potentiel olien. Les donnes
ainsi collectes sont disponibles chaque intervalle de dix minutes, tant pour
la vitesse que pour la direction des vents et sont disponibles pour une priode
12

qui varie dun neuf ans, dpendamment des sites tudis. Notons quen g-
nral, les donnes collectes sont disponibles sur une priode dun deux ans
seulement. Dans le cadre de cette tude, nous avons recherch des sites pour
lesquels la compagnie Hatch avait des donnes collectes sur de plus longues
priodes afin davoir plus de latitude pour nos analyses.

Comme nous nutilisons pas les directions du vent dans ce mmoire, nous in-
troduisons maintenant une notation pour la vitesse du vent collecte sans sa
direction respective. On notera par ya,i,j la vitesse du vent en m/s lanmo-
mtre a, a=1,2,3,4, collecte durant lheure i, i=0,1,...,N et pour lindice des dix
minutes j, j=1,2,...,6. Lindice j va de 1 6 puisque pour chaque heure i on a
six priodes de dix minutes indices de 1 6.

Pour ce type de donnes, nous nous proccuperons au chapitre 3 des donnes


aux dix minutes seulement. Pour simplifier la notation on utilisera donc plutt
ya,i o i=0,...,N10 reprsentera maintenant lindice du temps aux dix minutes.
On notera donc par (N10 + 1) le nombre de donnes de vitesse du vent aux dix
minutes disponibles, sans perte de gnralit par rapport au site. Au chapitre
4, on utilisera les donnes aux dix minutes et on se proccupera seulement
de lanmomtre 1. On utilisera donc yi o i=0,1,...,N10 est lindice associ aux
priodes de dix minutes. Au chapitre 5, on fera la rgression des donnes ob-
serves sur les donnes simules ou de station de rfrence. Comme ces deux
derniers types de donnes sont disponibles aux heures seulement, on pren-
dra la moyenne des six observations dune mme heure pour les donnes me-
sures. De plus, on utilisera dans ce chapitre les donnes de lanmomtre 1
seulement. On aura donc plutt les donnes yi o
6
1X
yi = y1,i,j . (2.1.1)
6 j=1

On retrouve la section 2.2 les dtails concernant le traitement des donnes


manquantes lors du calcul de ces moyennes horaires.

2.1.2. Les donnes simules de type mso-chelle

Il sagit de lune des rfrences plus long terme utilise par les ingnieurs
dans le domaine de lolien. Les donnes sont simules partir dun modle
mathmatique sur ordinateur qui tient compte de divers indices environne-
mentaux comme la temprature extrieure, lhumidit relative, la densit de
lair, etc. Il va sans dire que ces donnes ne sont disponibles que pour le pass
13

puisque leur simulation ncessite ces informations. De plus, les donnes sont
simules pour un site bien prcis. Notez que le terme simules fait ici rfrence
un modle mathmatique dterministe, par opposition une simulation ala-
toire.

Pour obtenir lun de ces jeux de donnes, on doit contacter une compagnie sp-
cialise en simulation des donnes de vitesse du vent et les prix pour une seule
srie simule sur dix ans peuvent atteindre des centaines, voire des milliers
de dollars. Cest pourquoi les travailleurs de lindustrie olienne voudraient
sassurer que ces jeux de donnes, quoique ne reprsentant pas des donnes
mesures, soient fiables et quils peuvent tre utiliss comme rfrence long
terme de la tendance de la vitesse du vent.

Nous utilisons ici les sries de donnes de vent simules dune compagnie
particulire afin de tester lefficacit de ces donnes. Les donnes de vitesse
du vent et de la direction du vent sont disponibles pour chaque heure, sur dix
ans. Ici encore, nous nutiliserons pas les donnes de direction du vent dans
notre tude. Des jeux de donnes simules ont t commands pour reprsen-
ter chaque site o des donnes collectes taient disponibles. On notera par xs,i
la vitesse simule du vent en m/s pour lheure i, i=Smin ,Smin + 1,...,-1,0,1,...,N.
On remarque donc que la fin de la srie des donnes simules concordera avec
la fin des donnes collectes, en terme de temps. De plus, Smin reprsentera
lindice de la premire heure o lon possde une valeur de donne simule de
la vitesse du vent.

2.1.3. Les donnes dune station de rfrence comme celles dEnvironne-


ment Canada

Il est possible dobtenir gratuitement des donnes sur la vitesse et la di-


rection du vent chaque heure, pour divers endroits au Canada, par lentre-
mise des stations de mesure dEnvironnement Canada. Cependant, ces stations
de rfrence ne sont pas disponibles pour tous les sites o des donnes ont
t collectes. De plus, elles peuvent tre situes plusieurs kilomtres des
mts de mesures o la compagnie Hatch collecte ses donnes, faisant en sorte
que ces stations de rfrence reprsentent souvent des donnes de moindre
valeur pour valuer le potentiel olien aux endroits dsirs. On voudrait tout
de mme tester leur utilit dans lvaluation du potentiel olien. Notez que
ces donnes sont elles aussi collectes sur des mts de mesure mais que ces
mts sont beaucoup plus courts que ceux utiliss par la compagnie Hatch (10-
20 mtres de haut versus 40 mtres).
14

Pour les sites tudis hors-Canada, dautres stations de rfrence semblables


ont aussi t utilises.

On notera donc par xr,i la vitesse fournie par la station de rfrence pour
lheure i, i=Rmin ,Rmin +1,...,-1,0,1,...,N. Comme pour les donnes mso-chelle,
la fin de la srie concorde avec les donnes collectes en terme de temps. Rmin
reprsente lindice de la premire heure o nous possdons une valeur de vi-
tesse du vent collecte la station de rfrence. Rmin peut tre infrieur, gal ou
suprieur Smin . Cependant, nous utiliserons gnralement les deux types de
donnes sur une priode de temps commune o les deux sont disponibles. No-
tez que nous possdons des donnes provenant de stations de rfrence pour
seulement 15 des 31 sites ltude.

2.1.4. Un exemple de statistiques descriptives pour les trois jeux de don-


nes

Voici maintenant un rsum descriptif des trois types de jeux de donnes


au site 1. Cela nous permet de voir la diffrence, surtout en terme de moyenne,
des vitesses de vent qui sont collectes aux mts de la compagnie Hatch, de
celles collectes par les stations de rfrence et des donnes simules partir
dun modle mso-chelle.
TABLEAU 2.1. Statistiques descriptives de la vitesse du vent
(m/s) horaire pour les trois jeux de donnes du site 1 sur une
priode de temps commune (N=72 704)

Donnes Minimum Q1 Moyenne Q3 Maximum


Collectes 0,315 4,962 7,086 8,908 22,850
Station de rfrence 0,000 1,340 2,930 4,190 14,580
Mso-chelle 0,000 4,400 6,586 8,300 24,400

En gnral, on observe que la moyenne de la vitesse du vent enregistre aux


stations de rfrence est plus basse que celle des donnes collectes ou mso-
chelle. Cela serait caus par la hauteur des mts des stations de rfrence. En
effet, la vitesse du vent augmente gnralement avec la hauteur et ces mts
sont beaucoup plus courts que ceux utiliss par la compagnie Hatch. On peut
aussi remarquer que la moyenne de la vitesse du vent des donnes mso-
chelle nest pas si prs de celle des donnes collectes par Hatch bien quelles
soient planifies pour simuler le vent la mme hauteur. la lumire de ces
chiffres, on comprend pourquoi lindustrie ne peut pas utiliser les donnes
15

simules mso-chelle seules dans lestimation de la vitesse du vent pass,


tout comme les donnes provenant des stations de rfrence. Ces deux jeux
de donnes doivent tre utiliss conjointement aux donnes collectes pour
quils soient utiles.

2.2. L E TRAITEMENT DES DONNES MANQUANTES


Il est important de noter que pour deux des trois types de donnes consi-
dres dans ce mmoire, des donnes manquantes sont prsentes et peuvent
influencer nos rsultats. En effet, pour les donnes collectes aux mts de me-
sure ainsi que pour les donnes provenant dune station de rfrence, jusqu
75% et 11,7% des donnes dune srie peuvent tre manquantes, respective-
ment, et ce pour des priodes de temps trs variables. Notez que le site o
75% des donnes collectes sont manquantes est un cas isol. On aura gn-
ralement entre 0% et 22% de donnes manquantes aux mts de mesure de la
compagnie. On sait que le gel, entre autres, causerait des arrts du matriel
install aux mts de mesure ncessitant souvent une intervention humaine sur
place.

Aucune analyse pousse na t effectue dans le cadre de ce mmoire, afin


de vrifier si les donnes manquantes taient bien rparties (prfrablement
rparties de manire alatoire), de sorte minimiser le biais dans les rsul-
tats. Pour le calcul des moyennes aux heures de la srie aux dix minutes de
donnes collectes aux mts de mesure, la moyenne tait calcule sur les ob-
servations qui ne sont pas manquantes. Par exemple, si au moins lune des
donnes dix minutes de la prochaine heure sur six ntait pas manquante, on
avait une donne de vitesse du vent horaire non manquante pour cette heure-
l, qui consistait en la moyenne des donnes aux dix minutes disponibles. La
moyenne horaire de la vitesse du vent pouvait donc tre calcule de la sorte,
lanmomtre 1 :
pi
1 X
y1,i = y1,i,j ,
pi j=1

o pi reprsente le nombre de donnes aux dix minutes qui ne sont pas man-
quantes pour lheure i. Rappelons que i = 0,...,N pour la srie de vitesses
de vent collectes, o la vitesse moyenne horaire au temps 0 est celle calcule
en faisant la moyenne des six prochaines observations aux dix minutes. Par
exemple, si lheure 0 se produit lorsquil est 0h00 un site particulier, la vitesse
moyenne correspondante lheure 0 sera celle calcule partir des vitesses de
16

vent collectes aux heures 0h00, 0h10, 0h20, 0h30, 0h40 et 0h50 qui ne sont pas
manquantes. Pour les donnes manquantes aux dix minutes ou aux heures et
sur lesquelles des calculs ont t entrepris dans les chapitres 3, 4 ou 5, notez
que les nombres N et N10 ont t rajusts de sorte quils reprsentent bien le
nombre de donnes non manquantes.

2.3. L ES DIVERS SITES TUDIS


Dans loptique danalyser plusieurs donnes de vent provenant de divers
milieux, la compagnie Hatch a slectionn quelques 31 sites travers le monde,
ces sites ayant comme point commun des mts de mesure o des donnes sur
la vitesse et la direction du vent ont t collectes sur une priode de plus dun
an. On peut diffrencier ces sites par diverses caractristiques physiques, par
exemple le fait quil y ait de grands arbres autour dun mt un site particulier
ou plutt de petits arbres, ce qui influencerait la quantit de vent reue au mt.
Le but de lanalyse ntant pas de comparer les sites par rapport leurs carac-
tristiques respectives, celles-ci ne seront pas prsentes. La figure 2.1 prsente

F IGURE 2.1. Diffrents emplacements des mts de mesure (tri-


angles rouges et verts)

les diffrents endroits dans le monde pour lesquels on possde des donnes
de vent tant collectes que simules. Les endroits reprsents par des triangles
rouges ou verts seulement sont les sites o lon possde ces deux types de don-
nes et sont donc les sites analyss. Les triangles bleus ne sont pas considrs
dans ce mmoire.
Chapitre 3

EXTRAPOLATION DES VITESSES DE VENT

partir des donnes de vitesse du vent aux dix minutes des anmomtres
1 (y1,i ), 2 (y2,i ) et 3 (y3,i ), i = 0,1,...,N10 , il est possible destimer la vitesse du
vent une hauteur dsire, quivalente la hauteur laquelle on voudrait
installer une turbine olienne. Pour ce faire, on doit se baser sur certaines lois
physiques. On utilise ici la loi de puissance pour expliquer le profil du vent.

3.1. L A LOI DE PUISSANCE POUR MODLISER LE PROFIL DU VENT


La loi de puissance (Peterson, 1978) explique la relation entre les vitesses du
vent et la hauteur laquelle ces vents sont mesurs. Elle permet donc dobtenir
une estimation de la vitesse du vent une hauteur dsire, si on possde au
moins deux autres vitesses de vent deux hauteurs diffrentes.

Loi de puissance :
   
vitesse hauteur
log = log , (3.1.1)
vitesseref hauteurref
o est le coefficient de cisaillement du vent (cest pour lestimation de ce
coefficient quon a besoin dau moins deux vitesses de vent deux hauteurs
diffrentes), vitesse et hauteur reprsentent la vitesse du vent que lon cherche
et la hauteur dsire dextrapolation et hauteurref et vitesseref sont la vitesse
du vent et la hauteur de rfrence.

Il est possible de retravailler la formule prcdente afin dobtenir une relation


entre le logarithme des vitesses du vent et celui des hauteurs. On obtient ainsi
la rgle suivante :

log(vitesse) = log(vitesseref ) log(href ) + |{z}


log(h), (3.1.2)
| {z }
"ordonne lorigine" "pente"
18

o lon peut remarquer que le coefficient de cisaillement reprsente la pente


de la rgression linaire simple entre les logarithmes des vitesses et des hau-
teurs, en prenant pour acquis que la partie note en (3.1.2) comme lordonne
lorigine est constante, cette quantit dpendant du coefficient de cisaillement
ainsi que de la vitesse et de la hauteur dun point de rfrence. On tiendra donc
compte de cette information afin de pouvoir estimer le coefficient de cisaille-
ment dans la prochaine section.

3.1.1. Les mthodes dextrapolation et lestimation du coefficient de ci-


saillement

On doit dabord distinguer deux mthodes gnrales que nous avons utili-
ses pour extrapoler la vitesse du vent un certain point : celle dj utilise par
la compagnie Hatch, que nous appellerons la mthode du point de rfrence et
celle que nous proposons dans ce mmoire, appele la mthode de la rgres-
sion. Les diffrentes mthodes seront testes la prochaine sous-section. Nous
commenons dabord par les prsenter.

Dabord, la mthode du point de rfrence pour estimer le coefficient de ci-


saillement puis extrapoler les donnes consiste driver de la formule (3.1.1)
une formule directe pour obtenir la vitesse la hauteur dsire (hauteur) dans
la mme formule. On transforme donc (3.1.1) de la faon suivante :

   
vitesse hauteur
log = log
vitesseref hauteurref
     
vitesse hauteur
exp log = exp log
vitesseref hauteurref
  
vitesse hauteur
= exp log ,
vitesseref hauteurref

ce qui nous mne a la formule dextrapolation :


  
hauteur
vitesse = vitesseref exp log . (3.1.3)
hauteurref

Dans cette mme formule, on peut donc utiliser diffrentes hauteurs et vitesses
de rfrence. Par exemple, si lon possde des donnes de vitesse du vent aux
anmomtres 1, 2 et 3, et quon dsire extrapoler une hauteur o lon ne pos-
sde aucune vitesse du vent collecte, on peut utiliser la vitesse de rfrence
19

et la hauteur de rfrence de lanmomtre 1, de lanmomtre 2 ou du troi-


sime anmomtre. Notez que lanmomtre 1 est gnralement celui utilis
pour extrapoler la vitesse du vent une hauteur plus grande que celle du mt
de mesure, puisque quil sagit de lanmomtre le plus haut sur le mt et quil
est postul que les donnes qui y sont collectes devraient donc tre plus re-
prsentatives de la vitesse du vent un point plus haut.

La hauteur et la vitesse de rfrence ne sont pas les seules quantits que nous
pouvons faire varier pour obtenir une extrapolation diffrente ; on considre
aussi deux faons diffrentes destimer le coefficient de cisaillement , soient
le calcul global et le calcul local. Le calcul global est prsentement utilis par la
compagnie Hatch pour faire les extrapolations, entre autres parce quil est plus
rapide et pratique faire. Nous avons suggr lutilisation du coefficient de
cisaillement local dans leur formule dextrapolation et comparerons leur per-
formance un peu plus tard. Nous croyons que lutilisation dun coefficient de
cisaillement local (variant aux dix minutes) mnera possiblement des pr-
visions plus prcises puisquon pourrait penser que le coefficient sadaptera
mieux aux variations de la vitesse du vent dans le temps.

Comme on a pu remarquer en (3.1.2), le coefficient de cisaillement reprsente,


en quelque sorte, la pente de la rgression linaire entre le logarithme des vi-
tesses de vent et le logarithme des hauteurs auxquelles ces vents sont collec-
ts. Le calcul global du coefficient de cisaillement sera donc fait en utilisant
comme vitesses dans cette rgression les vitesses moyennes aux divers anmo-
mtres sur toute la priode collecte. On aura donc, dans la rgression linaire,
la variable dpendante va qui reprsente le logarithme de la vitesse moyenne
lanmomtre a, a = 1,...,A, i.e. va = log(Y a ) o
N10
1 X
Ya = ya,i .
N10 i=1

La variable indpendante utilise dans la rgression est le logarithme de la


hauteur de lanmomtre, soit ua = log(ha ). On pourra donc estimer le coeffi-
cient de cisaillement global G partir des moindres carrs comme suit :
PA
(ua u)va
G = Pa=1
A
, (3.1.4)
(u u) 2
a=1 a
A
o u = A1 a=1 ua , avec A le nombre danmomtres disponibles utiliss dans
P

le calcul. Notez quil aurait t possible aussi de modliser de faon diff-


rente la relation entre le logarithme des hauteurs et des vitesses. Effectivement,
20

pour le moment, les ingnieurs calculent la vitesse moyenne du vent diff-


rentes hauteurs et modlisent la relation linaire entre le logarithme des vi-
tesses moyennes sur le logarithme des hauteurs, et cest donc ce quon a fait ici.
Or, on sait que la relation est prsente au niveau du logarithme de la vitesse
par rapport au logarithme de la hauteur, et quune rgression entre le loga-
rithme des vitesses spares aux 10 minutes et du logarithme des hauteurs est
quivalente une rgression de la moyenne des logarithmes de vitesses aux
dix minutes sur le logarithme de la hauteur. On aurait donc aussi pu utiliser la
moyenne des logarithmes des vitesses, plutt que le logarithme de la vitesse
moyenne du vent.

On voudrait aussi tester lextrapolation faite partir dun coefficient de cisaille-


ment qui serait r-estim pour chaque dix minutes. On appellera ce coefficient
le coefficient de cisaillement local. On devra donc modifier le coefficient L,i
pour chaque indice i correspondant aux priodes de dix minutes lorsquon ex-
trapolera les vitesses de vent la hauteur h dsire, contrairement au G qui
demeure le mme pour chaque extrapolation dune vitesse de vent. On red-
finit donc un nouveau vecteur pour la variable dpendante de la rgression
linaire effectue pour trouver le coefficient de cisaillement. Il sagit mainte-
nant de wa,i = log(ya,i ), toujours avec la variable indpendante ua dfinie plus
haut. On peut maintenant estimer le coefficient de cisaillement local aux dix
minutes L,i comme suit :
PA
a=1 (ua u)wa,i
L,i = P A
, i = 0,1,...,N10 . (3.1.5)
2
a=1 (ua u)

On peut donc dire qu partir de la formule dextrapolation (3.1.3) utilise par


la compagnie Hatch, on a deux faons destimer la vitesse du vent une hau-
teur h dsire partir dune hauteur de rfrence ha et de la vitesse du vent
collecte un anmomtre a plus bas (ya,i ), soient les mthodes du point de
rfrence globale ou locale :
  
h
ya,i,G = ya,i exp G log
ha
  
h
ya,i,L = ya,i exp L,i log .
ha

Dpendamment du nombre danmomtres installs un mt, on aura donc


plusieurs estimations de la vitesse du vent la hauteur h, partir de ces deux
mthodes. En effet, on verra sur les figures 3.1 et 3.2 que la mthode du point
21

de rfrence est quivalente utiliser un point de rfrence sur lequel on trans-


late la droite de rgression linaire afin de prdire, au logarithme de la hauteur
dsire, le logarithme de la vitesse du vent.

Voyons maintenant la mthode dextrapolation que nous proposons, soit celle


de la rgression. Comme il y a une relation linaire entre le logarithme des
vitesses (ou vitesses moyennes) et des hauteurs, on pense utiliser cette rela-
tion afin de prdire partir de la rgression linaire la vitesse une certaine
hauteur. On nutilise donc plus la notion de hauteur de rfrence. On fait donc
lhypothse que le logarithme de la vitesse du vent (m/s) est reli au loga-
rithme de la hauteur (m) de la faon suivante :

log(v) = 0 + 1 log(h) + .

Dans cette formule, 0 et 1 sont des coefficients expliquant la relation linaire


entre les deux logarithmes et est le bruit du modle linaire. Comme on a vu
en (3.1.2), 1 est quivalent au coefficient de cisaillement et 0 correspond
lordonne lorigine de la droite de rgression. Comme pour la mthode du
point de rfrence, il est possible de calculer le coefficient de cisaillement de
deux faons distinctes, qui sont encore la faon globale et locale. On aura donc,
ici aussi, deux faons de prdire : la faon globale puis locale, toutes deux
partir de la droite de rgression et des coefficients estims par les formules des
moindres carrs.

Supposons donc que nous avons les donnes collectes A hauteurs diff-
rentes et que nous dsirons extrapoler une hauteur h la vitesse du vent, afin
dobtenir une vitesse estime yi au temps i, i=0,1,...,N10 . On doit dabord esti-
mer les coefficients de la rgression linaire, pour les deux mthodes. Dans le
cas de la mthode globale, on utilise la variable dpendante va et la variable
indpendante ua , telles que dfinies plus tt. On obtient les estimateurs des
coefficients de rgression linaire suivants :

G,0 = v G,1 u,

o G,1 est dfini en (3.1.4) et v = A1 A


P
a=1 va . Pour la mthode locale, on estime
ces coefficients pour chaque priode de dix minutes :

L,i,0 = wi L,i,1 u,

o L,i,1 est dfini en (3.1.5) et wi = A1 A


P
a=1 wa,i . On peut ensuite prdire au
logarithme de la hauteur, le logarithme de la vitesse recherche. On obtient les
22

deux faons suivantes dextrapoler :

yG = exp (G,0 + G,1 log(h)) (3.1.6)

yi,L = exp (L,i,0 + L,i,1 log(h)) .

Notez que la valeur de yG ne change pas avec lindice de temps. On a donc,


partir de la formule (3.1.6), une seule valeur prdite la hauteur h. On peut
donc sattendre ce que cette mthode noffre pas ncessairement de bonnes
estimations ponctuelles de la vitesse du vent. Par contre, si on sintresse la
vitesse moyenne du vent plutt qu chaque vitesse individuelle aux dix mi-
nutes, cette mthode pourrait tre adquate.

Afin de bien comprendre chacune des mthodes utilises pour lextrapolation


de la vitesse du vent, nous illustrons dabord la figure 3.1 les divers cas dex-
trapolation pour un coefficient de cisaillement calcul aux dix minutes, soient
la mthode du point de rfrence et la mthode de la rgression, pour les cas o
des donnes sont disponibles deux ou trois hauteurs diffrentes. En effet,
les sites pour lesquels des donnes collectes sont disponibles sont ceux o des
anmomtres sont installs trois ou quatre hauteurs. Cependant, comme on
dsire estimer lerreur quadratique moyenne dextrapolation en prdisant la
vitesse du vent au plus haut point disponible, on devra garder les donnes de
lanmomtre le plus haut sur le mt titre de validation et les calculs de coef-
ficients de cisaillement se feront partir dune hauteur de moins. Les donnes
utilises dans notre exemple sont celles du site 31, pour lequel nous possdons
les vitesse de vent quatre hauteurs diffrentes. titre dillustration, nous al-
lons donc reprsenter le logarithme des vitesses pour le temps i=113 501 et
celui des hauteurs des anmomtres 2, 3 et 4 pour extrapoler lanmomtre
1. Le graphique de gauche de la figure 3.1 prsentera la mthode du point de
rfrence, pour 2 ou 3 points utiliss et le graphique de droite prsentera la
mthode de la rgression pour extrapoler partir de 2 ou 3 points. On verra
donc, entre autres, la diffrence entre le fait dutiliser deux ou trois points afin
dextrapoler. En effet, la compagnie Hatch utilise prsentement les deux points
les plus hauts pour extrapoler mme si elle possde des donnes plus de
deux hauteurs, afin de simplifier la mthode dextrapolation, et nous propo-
sons den utiliser le plus possible (gnralement un maximum de trois points
trois hauteurs diffrentes). Le logarithme de la vritable vitesse du vent col-
lecte lanmomtre 1 sera aussi montr afin dvaluer lerreur dextrapo-
lation. Rappelons-nous que ces graphiques prsentent les prvisions du vent
23

sur lchelle logarithmique. On utilise le logarithme de la hauteur de lanmo-


mtre 1 pour estimer le logarithme de la vitesse cet anmomtre. Pour obtenir
la vitesse estime, on doit changer dchelle en calculant lexponentielle de la
valeur obtenue partir des diverses mthodes.

On remarque la figure 3.1 que la mthode du point de rfrence deux points

F IGURE 3.1. Les quatre mthodes dextrapolation partir dun


coefficient de cisaillement local, au temps i=113 501. La droite
noire pleine la moins fonce reprsente la rgression linaire faite
partir des deux vitesses (anmomtres 2 et 3) et lautre, celle
faite partir des trois vitesses (anmomtres 2, 3 et 4). Les points
noirs sont les logarithmes des vitesses par rapport aux loga-
rithmes des hauteurs pour les trois anmomtres. La ligne poin-
tille verticale est situe en x=log(h1). Les toiles sont les pr-
visions partir des trois diffrentes hauteurs de rfrence (gra-
phique de gauche), ou de la rgression linaire trois points (gra-
phique de droite). Le losange noir est le logarithme de la vitesse
mesure en h1 et les triangles vides sont les prvisions partir
de la rgression sur deux points.

et la mthode de la rgression deux points mnent la mme extrapolation,


peu importe la hauteur de rfrence utilise. Cela est d au fait que la mthode
du point de rfrence utilise la mme droite de rgression que la mthode de
la rgression et la dplace sur chaque point afin de faire une prvision. Ainsi,
lorsque cette droite est dplace sur les deux points qui la dfinissent, il ny a
aucune diffrence peu importe le point de rfrence et la droite reste donc au
mme endroit quavec la mthode de la rgression, menant la mme seule
24

prvision. En ce qui a trait aux mthodes trois points, remarquez que la m-


thode du point de rfrence peut mener des extrapolations trs diffrentes
dpendamment de la hauteur de rfrence utilise. Pour le site 31 et le temps
i=113 501, on remarque une petite diffrence entre les extrapolations pour dif-
frentes hauteurs de rfrence (surtout en calculant lexponentielle des trois
prvisions sur le graphique, ce qui nous mnerait lestimation de la vitesse
du vent, car souvenons-nous que le graphique prsente les prvisions sous
lchelle logarithmique). Dans le cas o un des points serait situ assez loin de
la droite de rgression, on pourrait observer une extrapolation assez diffrente
en utilisant la hauteur de rfrence correspondante ce point. Quant la m-
thode de la rgression trois points, lextrapolation demeurera toujours sur la
droite de rgression.
25

F IGURE 3.2. Les mthodes dextrapolation partir dun coeffi-


cient de cisaillement global, au temps i=113501. La droite noire
pleine reprsente la rgression linaire faite partir des deux vi-
tesses moyennes sur toute la priode (anmomtres 2 et 3), et la
droite pointille, celle faite partir des trois vitesses moyennes
sur toute la priode (anmomtres 2, 3 et 4). Les points noirs
sont les logarithmes des vitesses par rapport aux logarithmes des
hauteurs pour les trois anmomtres. Les triangles noirs sont les
logarithmes des vitesses moyennes sur toute la priode par rap-
port aux logarithmes des hauteurs pour les trois anmomtres.
La ligne pointille verticale est situe en x=log(h1). Les toiles
sont les prvisions partir des trois diffrentes hauteurs de rf-
rence (graphique de gauche), ou de la rgression linaire trois
points (graphique de droite). Le losange noir est le logarithme de
la vitesse mesure en h1. Les triangles vides sont les prvisions
partir de la rgression sur deux points.

Regardons maintenant la figure 3.2, qui illustre chacune des mthodes dextra-
polation lorsquun coefficient de cisaillement global est utilis, toujours partir
des donnes du site 31 et du temps i=113 501. On doit maintenant noter que
pour le graphique de droite, soit la mthode de la rgression deux ou trois
points avec un coefficient de cisaillement global, une seule extrapolation est
possible partir dune hauteur donne, quelles que soient les vitesses de vent
aux dix minutes. On aura donc, pour toute priode de dix minutes, la mme
valeur extrapole lanmomtre 1. On remarque aussi que les droites de r-
gression sur deux ou trois points varient trs peu ici, lorsquon utilise la vitesse
moyenne sur toute la priode. Cela produit donc des prvisions au logarithme
26

de la hauteur 1 qui sont trs similaires quand on utilise un coefficient global,


quelles soient faites partir des donnes de deux ou trois anmomtres.

3.2. D TERMINATION DE LA MTHODE OPTIMALE D EXTRAPO -


LATION

Voyons maintenant comment nous dterminerons la mthode qui offre les


meilleurs rsultats en terme dextrapolation.

Nous utiliserons ici le calcul de lerreur quadratique moyenne dextrapolation


au plus haut point (lanmomtre 1) afin dvaluer la prcision de la prvision
individuelle, aux dix minutes, de la vitesse du vent. De plus, nous dsirons
valuer la qualit de la prvision moyenne sur toute la priode de donnes
mesures disponibles. En effet, les ingnieurs oliens ont parfois davantage be-
soin dune valuation de cette moyenne un site que de chaque vitesse ponc-
tuelle horaire ou aux dix minutes. On comparera donc la vraie moyenne de la
vitesse du vent lanmomtre 1 et la moyenne de la vitesse du vent extrapole
la hauteur de lanmomtre 1, soient :
N10
1 X
y1 = y1,i
N10 + 1 i=0
et
N
10
1 X
y E = yi,E ,
N10 + 1 i=0

o E est la mthode dextrapolation utilise. Cela permettra de vrifier laquelle


des mthodes serait la plus efficace en terme destimation de la vitesse de vent
moyenne.

Comme lon dsire calculer lerreur dextrapolation et que lon se basera sur les
donnes mesures lanmomtre 1, on nutilisera pas dans nos estimations
de la vitesse extrapole les donnes de lanmomtre 1. Pour 30 des 31 sites,
nous navons que trois hauteurs diffrentes o des donnes sont mesures, ne
nous laissant la possibilit dutiliser que deux des trois anmomtres (les an-
momtres 2 et 3) pour extrapoler au plus haut anmomtre. Nous utiliserons
donc ces vitesses pour faire les rgressions linaires ncessaires et extrapola-
tions, telles que vues la section prcdente. Pour le site 31, nous utiliserons
aussi les donnes de lanmomtre 4, situ sous lanmomtre 3. Nous extra-
polerons donc partir des diverses mthodes et calculerons dans un premier
temps lEQM entre les valeurs estimes et les valeurs relles de vitesse du vent
27

collectes lanmomtre 1.

LEQM dextrapolation (EQME) sera calcule comme suit :


10 N
1 X
EQM E = (y1,i yi,E )2 ,
N10 + 1 i=0

o E reprsente la mthode dextrapolation utilise. On prsente maintenant


les EQME pour chaque mthode dextrapolation et pour chaque site. LEQME
minimale pour chaque site est mise en gras dans les prochains tableaux.

TABLEAU 3.1. EQME calcule partir des diverses mthodes


dextrapolation, pour les sites 1 30 (2 anmomtres disponibles
seulement)

Site y2,i,G y2,i,L yG yi,L Site y2,i,G y2,i,G yG yi,L


1 0,149 0,286 9,107 0,286 16 0,076 0,057 8,669 0,057
2 0,095 0,110 28,087 0,110 17 0,032 0,023 8,075 0,023
3 0,071 0,069 11,144 0,069 18 0,185 0,288 12,656 0,288
4 0,071 0,270 8,953 0,270 19 0,032 0,019 10,704 0,019
5 0,222 0,148 12,657 0,148 20 0,039 0,028 10,026 0,028
6 0,097 0,086 9,038 0,086 21 0,634 0,747 18,980 0,747
7 0,046 0,053 7,095 0,053 22 0,129 0,053 13,658 0,053
8 0,107 0,166 13,467 0,166 23 1,432 1,207 13,352 1,207
9 0,052 0,067 13,103 0,067 241 - - - -
10 0,165 0,142 11,749 0,142 25 0,025 0,040 16,890 0,040
11 0,163 0,076 7,688 0,076 26 0,189 0,208 18,209 0,208
12 0,030 0,023 6,299 0,023 27 0,223 0,195 27,689 0,195
13 0,303 3,039 18,188 3,039 28 1,406 1,501 17,557 1,501
14 0,071 0,085 25,538 0,085 29 0,243 0,168 8,905 0,168
15 0,065 0,069 13,706 0,070 30 0,126 0,220 10,995 0,220
1
Le site 24 ne possde pas dautres anmomtres que les deux plus hauts donc ce test ne sapplique pas
ce site.

TABLEAU 3.2. EQME calcule partir des diverses mthodes


dextrapolation, au site 31

Site Nb de hi y4,i,G y3,i,G y2,i,G y4,i,L y3,i,L y2,i,L yG yi,L


utilis
31 3 2,619 0,273 0,083 0,105 0,212 0,071 7,915 0,114
2 - - 0,083 - - 0,093 8,252 0,093

Notez que nous avons pu calculer lEQME partir de trois hauteurs (anmo-
mtres 2, 3 et 4) ou de deux hauteurs seulement (anmomtres 2 et 3), comme
28

le fait Hatch, pour le site 31, puisque nous possdons des donnes quatre
hauteurs pour ce site, et que nous avons donc prsent les rsultats pour les
diffrents nombres danmomtres utiliss. Ces rsultats se retrouvent dans le
tableau 3.2.

En ce qui a trait la comparaison des vitesses extrapoles moyennes et de la


vitesse collecte moyenne lanmomtre 1, on calcule lerreur relative entre
ces deux mesures pour chaque mthode dextrapolation. Lerreur relative est
calcule comme suit :
y E y 1
ER = 100 .
y1
On prsente maintenant les erreurs relatives entre les vitesses de vent moyennes
pour chaque mthode dextrapolation et pour chaque site. En gras, on retrouve
pour chaque site lerreur relative minimale.

TABLEAU 3.3. Erreurs relatives (%) entre la vitesse collecte


moyenne lanmomtre 1 et les vitesses extrapoles moyennes
calcules partir de chaque mthode, pour les sites 1 30 (2 an-
momtres disponibles seulement)

Site y 2,i,G y 2,i,L y G y i,L Site y 2,i,G y 2,i,L y G y i,L


1 2,661 2,393 2,661 2,393 16 2,287 2,032 2,287 2,032
2 0,768 0,538 0,768 0,538 17 0,869 0,656 0,869 0,656
3 -2,294 -2,433 -2,294 -2,433 18 0,446 0,220 0,446 0,220
4 0,409 0,207 0,409 0,207 19 0,332 0,226 0,332 0,226
5 1,214 0,664 1,214 0,664 20 -0,453 -0,611 -0,453 -0,611
6 -0,485 -0,634 -0,485 -0,634 21 5,697 5,347 5,697 5,347
7 0,554 0,335 0,554 0,335 22 0,066 -0,140 0,066 -0,140
8 0,061 -0,188 0,061 -0,188 23 0,402 -0,314 0,402 -0,314
9 -0,202 -0,278 -0,202 -0,278 241 - - - -
10 0,669 0,388 0,669 0,388 25 0,455 0,293 0,455 0,293
11 -0,027 -0,338 -0,027 -0,338 26 0,325 0,107 0,325 0,107
12 -0,059 -0,150 -0,059 -0,150 27 -1,085 -1,264 -1,085 -1,264
13 -0,302 -1,130 -0,302 -1,130 28 4,726 4,312 4,726 4,312
14 1,634 1,492 1,634 1,492 29 0,896 0,479 0,896 0,479
15 -1,167 -1,316 -1,167 -1,316 30 1,521 1,261 1,521 1,261
1
Le site 24 ne possde pas dautres anmomtres que les deux plus hauts donc ce test ne sapplique pas
ce site.
29

TABLEAU 3.4. Erreurs relatives (%) entre les vitesses de vent


moyennes calcules partir des diverses mthodes dextrapola-
tion et la vitesse moyenne lanmomtre 1, au site 31

Site Nb de hi y 4,i,G y 3,i,G y 2,i,G y 4,i,L y 3,i,L y 2,i,L y G y i,L


utilis
31 3 -0,839 -1,113 -0,669 0,298 0,714 0,147 -0,669 0,340
2 - - 0,497 - - 0,010 0,497 0,010

Nous avons encore une fois test les mthodes dextrapolation utilisant deux
anmomtres (anmomtres 2 et 3) ou trois anmomtres (anmomtres 2, 3 et
4). Remarquez que nous ne notons dans le tableau que les rsultats pour une
hauteur de rfrence relie lanmomtre 2 lorsque nous utilisons deux an-
momtres pour extrapoler, puisque les rsultats sont les mmes si on utilise
la hauteur de rfrence de lanmomtre 3 (une rgression linaire sur deux
points mne la mme prvision, quon se base sur la hauteur relie au pre-
mier ou au deuxime point de la rgression, i.e. y2,i,G = y3,i,G et y2,i,L = y3,i,L si
lon utilise seulement les anmomtres 2 et 3).

3.2.1. Discussion

Dans ce chapitre, nous voulions vrifier si la mthode prsentement utilise


par Hatch pour lextrapolation de la vitesse du vent, soit lextrapolation par-
tir dun coefficient de cisaillement global base sur deux anmomtres, tait
adquate. Nous voulions voir leffet dutiliser un coefficient de cisaillement
local par rapport global, et sil est possible de diminuer lerreur quadratique
moyenne dextrapolation ainsi que lerreur relative de la moyenne de la vitesse
du vent estime par rapport la vraie moyenne, en utilisant un anmomtre
de plus pour extrapoler la vitesse du vent.

Tout dabord, on peut voir dans les tableaux 3.1 et 3.2 que, comme prvu, les
mthodes dextrapolation du point de rfrence et de rgression avec coeffi-
cient de cisaillement local mnent toujours aux mmes EQME si lon utilise
seulement deux anmomtres dans le calcul. Ensuite, si lon fait le dcompte
des mthodes o lon obtient les meilleurs rsultats, donc celles menant aux
EQME minimales (nombres en gras), on trouve que la mthode du point de r-
frence avec coefficient de cisaillement global offre le meilleur rsultat pour 16
des 30 sites o lon possdait des rsultats (en comptant le site 31). La moyenne
des erreurs quadratiques moyennes dextrapolation pour les 30 sites abonde
dans le mme sens, avec une moyenne dEQME de 0,219 pour lextrapolation
30

y 2,i,G , de 13,348 pour y G , et de 0,318 pour les mthodes y 2,i,L et y i,L en comp-
tant les extrapolations partir de deux anmomtres du site 31. Pour le site 31
et lextrapolation partir de trois anmomtres, la mthode optimale est celle
du point de rfrence avec coefficient de cisaillement local o la hauteur de
rfrence est h2 (donc lanmomtre le plus haut quon puisse utiliser). Lutili-
sation de trois hauteurs plutt que deux nous mne de bonnes amliorations
de lerreur quadratique moyenne dextrapolation (EQME de 0,071 contre 0,083
pour les meilleures mthodes trois ou deux hauteurs utilises, respective-
ment, ce qui quivaut donc une amlioration de 14%). De plus, on voit que
pour chaque anmomtre k, yk,i,L fait toujours mieux que yk,i,G et que lEQME
de yk,i,G diminue mesure quon prend un anmomtre plus haut (quivalent
un k qui diminue), mais que le comportement de yk,i,L ne suit pas la mme
tendance.

En ce qui a trait lerreur relative entre la vritable moyenne des vitesses de


vent lanmomtre 1 et la moyenne des vitesses de vent extrapoles la hau-
teur de lanmomtre 1 partir des diverses mthodes dextrapolation, on peut
voir dans les tableaux 3.3 et 3.4 que pour 19 des 30 sites o lon possde des
rsultats (en comptant le site 31), la meilleure mthode est celle du point de
rfrence avec coefficient de cisaillement local ou de la rgression avec coeffi-
cient de cisaillement local, qui menaient toujours aux mmes rsultats, comme
attendu. Ce sont donc ces deux mthodes qui russissent le mieux estimer la
moyenne de la vitesse du vent la hauteur dsire, ici. De plus, la moyenne
des erreurs relatives absolues est de 1,085% pour les mthodes y 2,i,G et y G et
de 0,992% pour les mthodes y 2,i,L et y i,L (notez quil sagit de faibles erreurs
relatives, puisquon parle derreurs autour de 1%). Si lon se base sur lesti-
mation de la moyenne de la vitesse extrapole, on prfrerait donc utiliser un
coefficient de cisaillement local plutt que global, cest--dire recalculer le co-
efficient de cisaillement chaque dix minutes au lieu de le calculer partir
des vitesses moyennes sur toute la priode o lon possde des donnes col-
lectes de vitesses du vent. Notez aussi que tel que prvu, les erreurs quadra-
tiques moyennes dextrapolation pour les prvisions y G sont terribles (on sy
attendait puisque la prvision demeure la mme peu importe le temps, pour
une mme hauteur) mais que la mthode nest pas si mal pour estimer le vent
moyen (elle mne aux mmes rsultats que la mthode du point de rfrence
avec coefficient de cisaillement global). Pour ce qui est du site 31 et de lex-
trapolation partir de trois anmomtres, lerreur relative minimale est celle
31

obtenue partir de la mthode du point de rfrence avec coefficient de ci-


saillement local et hauteur de rfrence h2 . Les meilleurs rsultats quant ler-
reur relative pour ce site sont obtenus en nutilisant que deux hauteurs pour
extrapoler h1 (erreurs relatives de 0,010% deux hauteurs utilises contre
0,147% trois hauteurs utilises, pour les meilleurs mthodes respectives) mais
on remarque que toutes les erreurs relatives sont infrieures 1,2% en valeur
absolue, donc la mthode importe peu pour ce site. Si on regarde lensemble
gnral des sites, on voit que lerreur relative est faible dans tous les cas et la
moyenne estime la hauteur h1 est assez prs de la moyenne mesure lan-
momtre 1. Les erreurs relatives sont toutes infrieures 6%, tous les sites et
les modles tant confondus.

De faon gnrale, on ne trouve pas de mthode qui se dmarque vraiment


des autres lorsquon utilise seulement deux anmomtres pour extrapoler
une troisime hauteur. Il semblerait aussi quil y ait un certain avantage uti-
liser un anmomtre de plus pour extrapoler ici. Par contre, il faut demeurer
prudent avec cette conclusion puisque nous navons pu comparer les extrapo-
lations bases sur deux anmomtres celles sur trois anmomtres que pour
un seul site. La mthode prsentement utilise par Hatch, soit lextrapolation
partir de deux hauteurs seulement et dun seul coefficient de cisaillement
global, semble donc tre plutt adquate puisque lutilisation dun coefficient
de cisaillement local (qui entrane des calculs un peu plus complexes) na pas
grandement amlior les rsultats ici. Or, on a remarqu au site 31 quon am-
liorait la prcision de 14% en utilisant 3 points (en termes dEQME) alors que
pour la moyenne, toutes les erreurs relatives taient plutt faibles (sous 1,2%).
Il pourrait donc tre avantageux pour la compagnie Hatch dutiliser un an-
momtre de plus et il aurait t intressant davoir les vitesses de vent quatre
hauteurs diffrentes pour plus de sites, afin de voir la tendance quant lutili-
sation dun anmomtre de plus.
Chapitre 4

MODLISATION DE LA DISTRIBUTION DE LA
VITESSE DES VENTS

La raison premire justifiant la modlisation de la distribution de la vitesse


des vents est le dsir de connatre les paramtres pouvant tenter de rsumer
eux seuls cette distribution. On fait dabord lhypothse que les vents peuvent
tre assez bien modliss par une loi dont les paramtres ne changeraient pas
ncessairement avec le temps. On utilisera les donnes de vitesse du vent aux
dix minutes du plus haut anmomtre de chaque site seulement (anmomtre
1) tout au long de ce chapitre et on fera dabord lhypothse que les donnes
sont indpendantes et identiquement distribues. La section 4.4.2 se concen-
trera sur la dpendance entre les observations.

Un grand nombre de mthodes permettant de modliser la distribution de la


vitesse des vents ont t explores dans la littrature. En effet, plus dune loi
de probabilit permettrait, partir de la fonction de densit respective, dap-
procher cette distribution. La loi la plus couramment utilise serait celle de
Weibull (Burton, 2011), quon verra dans la prochaine section et qui sera la loi
utilise tout au long du chapitre pour modliser la vitesse du vent. On retrouve
dautres distributions dans la littrature, comme celle de Rayleigh-Rice, et on
mentionne dans Drobinski (2012) quelle serait prfrable la distribution Wei-
bull lorsque les vents sont trs variables selon la direction dobservation (donc
pour des vents qui ne seraient pas isotropiques). Dans ce chapitre, nous tente-
rons de vrifier lajustement de la Weibull sur la distribution des vents, en plus
de tester si les paramtres de la Weibull devraient tre rajusts pour chaque
anne ou chaque mois plutt que de faon globale. Nous discuterons aussi de
lestimation de la production dnergie annuelle partir de la Weibull et de la
courbe de puissance associe aux turbines oliennes.
34

4.1. L A LOI DE Weibull ET SES CARACTRISTIQUES


En plus dtre la distribution utilise par la compagnie Hatch pour mod-
liser celle de la vitesse des vents lors du calcul de la production dnergie, il
est dit maintes reprises dans la littrature que la distribution des vitesses de
vent peut tre reprsente (ou encore, caractrise) par la fonction de densit
relie la loi de Weibull. Revoyons maintenant un rsum des caractristiques
de la loi Weibull.

La loi de Weibull deux paramtres est une loi de probabilit continue carac-
trise par les paramtres de forme, not k, et dchelle, not . La fonction de
densit de la Weibull est la suivante :

k  x k1 ( x )k
fk, (x) = e .

La fonction de rpartition de la Weibull, quant elle, est dfinie par :

x k
Fk, (x) = 1 e( ) .
Lesprance et la variance dune variable alatoire X de la distribution Weibull
sont respectivement donnes par :
 
1
Ek, (X) = 1 +
k
    
2 2 2 1
Vark, (X) = 1 + 1+ .
k k
La figure 4.1 montre quatre exemples de fonctions de densit dune Weibull.

Il est intressant de noter que la transformation vue dans le chapitre 3, soit


lextrapolation partir de la formule (3.1.3) dun jeu de donnes de loi Weibull,
mnera un nouveau jeu extrapol aussi de loi Weibull. Soit Z1 ,Z2 ,...,Zn un jeu
de donnes distribues selon une Weibull(k,) une hauteur href et E1 ,E2 ,...,En
ces mmes donnes une fois extrapoles une hauteur h partir de la formule
(3.1.3). On a donc ceci :

Ei =Zi exp((log(h) log(href )))


=Zi exp (cte),

o cte = (log(h)log(href )) est constant dans le cas o le coefficient de cisaille-


ment demeure le mme pour tout temps i. Ainsi, Ei est Weibull(k, exp(cte)).
Une fois nos vitesses de vent extrapoles, on peut donc toujours modliser la
distribution de la vitesse du vent par une Weibull, ce qui est utile lors de les-
timation de la production dnergie. En effet, les ingnieurs oliens feront leur
35

1.5
Densit ce point

1.0

chelle=0,5; forme=2,0
chelle=1,0; forme=2,0
chelle=1,5; forme=3,0
chelle=3,0; forme=4,0
0.5
0.0

0 1 2 3 4 5

valeur de x

F IGURE 4.1. Exemples de la fonction de densit dune distribu-


tion Weibull pour divers paramtres

estimation partir des donnes extrapoles la hauteur de la turbine quils d-


sirent installer. Notez que nous ne considrerons pas lextrapolation avant les-
timation de la production dnergie dans ce mmoire. Gnralement, comme
la hauteur laquelle est mesure la vitesse du vent est plus basse que celle
dune turbine olienne, les ingnieurs vont dabord extrapoler la vitesse la
hauteur correspondante la turbine, puis modliser la distribution une fois
extrapole afin destimer la production dnergie partir dune turbine parti-
culire. Or, ici, ces deux tapes seront vues de faon spare et lestimation de
la production dnergie sera faite sur des donnes non extrapoles.

4.2. L ESTIMATION DES PARAMTRES


Soit X1 ,X2 ,...,Xn un chantillon indpendant et identiquement distribu
selon une loi Weibull(k,). Diffrentes mthodes statistiques nous permettent
destimer les deux paramtres (de forme et dchelle) de la Weibull quon d-
sire ajuster sur la distribution de la vitesse des vents aux dix minutes en
mtres/seconde.
36

Dans ce mmoire, nous utilisons les paramtres estims partir de la fonction


de vraisemblance. Il est possible de trouver ces estimateurs partir dun logi-
ciel statistique ou en rsolvant lquation (4.2.1) par rapport k puis en calcu-
lant partir de la formule (4.2.2), pour arriver aux mmes rsultats (Johnson,
1994). !1
Pn k n
i=1 Xi log Xi 1X
k = Pn log Xi (4.2.1)
i=1 Xi
k n i=1

n
!1
k
1 X k
= X , (4.2.2)
n i=1 i

o n est le nombre dobservations sur lesquelles est ajuste la distribution.

Une fois que les estimateurs du maximum de vraisemblance (EVM) sont trou-
vs, il est possible de dessiner par-dessus lhistogramme des vitesses de vent
la courbe de densit de la Weibull ajuste. La figure 4.2 prsente un exemple
de lajustement dune fonction de densit de Weibull sur la distribution des vi-
tesses du vent en mtres/seconde. Les vitesses de vent utilises sont celles du
site 1, o environ neuf ans de donnes sont disponibles.
37

0.15
0.10
Frquence

0.05
0.00

0 5 10 15 20 25

Vitesse du vent aux dix minutes (m/s)

F IGURE 4.2. Exemple dajustement de Weibull sur lhisto-


gramme des vitesses du vent aux dix minutes au site 1, sur neuf
ans (k = 2,423, = 7,987)

4.3. V RIFICATION DE L AJUSTEMENT DE LA Weibull SUR LA DIS -


TRIBUTION DE LA VITESSE DES VENTS

En premier lieu, nous dsirons vrifier lajustement de la Weibull sur la dis-


tribution des vitesses de vent : quel point cette distribution sajuste bien, afin
de lutiliser pour estimer celle de la vitesse des vents ? On fait donc un test
dadquation du khi-deux pour vrifier si la Weibull convient la modlisation
des vitesses de vent aux dix minutes.

4.3.1. Tests dadquation pour la distribution Weibull

Ici, nous avons utilis le test du khi-deux. Celui-ci sapplique bien dans
notre cas, puisque nous pouvons utiliser ce test sur des intervalles dune lar-
geur de 1 m/s entre 0 et 25 m/s, sachant que la fonction de puissance est dis-
crtise de cette faon et que nous lutiliserons un peu plus tard. Pour utiliser
ce test, nous devions estimer les probabilits thoriques de se retrouver dans
chacune des classes de la distribution de la vitesse du vent, en se basant sur la
38

Weibull ajuste sur les donnes collectes de vitesse du vent. Pour ce faire, il fal-
lait dabord estimer les paramtres de la Weibull. Nous devions aussi calculer
les frquences de la vitesse du vent pour chacune des classes afin de les com-
parer aux probabilits thoriques estimes. Nous avons utilis, pour chaque
site, les classes de vitesses du vent collectes suivantes : [0,1[ m/s, [1,2[ m/s,...,
[24, + [ m/s.

Pour pouvoir comparer notre statistique de test un certain quantile de la 2 , et


donc pour avoir une distribution asymptotique qui soit 2 avec le bon nombre
de degrs de libert (nombre de catgories1nombre de paramtres), nous
avons estim les paramtres de la Weibull en maximisant la vraisemblance mul-
tinmiale, i.e. celle base sur les estimations des probabilits multinmiales des
25 classes (Rice, 2007). La probabilit que la vitesse Y appartienne la classe
allant de a b m/s est :

P (Y [a,b[) = P (Y < b) P (Y < a)


= Fk, (b) Fk, (a)
 k !!     
b a k
= 1 exp 1 exp

     k !
a k b
= exp exp . (4.3.1)

Pour trouver les estimateurs du maximum de vraisemblance de k et pour
ce test, on devait donc maximiser la formule suivante, par rapport ces deux
mmes paramtres :

N10 25
n
Y Y
pi = pj j , j=1,...,25 le nombre de classes
i=0 j=1
 k !  k !!n1
0 1
= exp exp ...

 k !!n25
24
exp

o les nj reprsentent le nombre de vitesses de vent collectes aux dix minutes


contenues dans chaque classe j. Ainsi, n25 contient le nombre dobservations
suprieures ou gales 24 m/s.
39

Pour maximiser cette vraisemblance, nous avons utilis un algorithme bas


sur une application de la mthode de Nelder et Mead (1965). La mthode de
Nelder et Mead est un algorithme doptimisation non-linaire cherchant mi-
nimiser une fonction continue dans un espace plus dune dimension. Cest la
fonction optim du progiciel Stats (voir le lien internet en rfrence), du logiciel
R qui nous a permis cette optimisation. On pouvait donc obtenir les estima-
teurs k et , que nous avons remplacs dans la formule (4.3.1) afin dobtenir les
probabilits estimes de se retrouver dans chaque classe, les pj , j=1,...,25.

Il ne reste, par la suite, qu comparer partir du test du Khi-deux les probabi-


lits estimes pour chaque classe aux probabilits mesures (quivalentes aux
frquences mesures de la vitesse du vent pour chaque classe respective).

Pour faire le test, on calcule la statistique du 2 , dfinie de la faon suivante :

25
X ((N10 + 1)fj (N10 + 1)pj )2
T = , (4.3.2)
j=1
(N10 + 1)pj

o (N10 + 1) reprsente toujours le nombre total de vitesses de vent disponibles


(la longueur de la srie chronologique sans les observations manquantes), les
fj reprsentent les probabilits empiriques (frquences pour chaque classe), et
les pj , les probabilits thoriques estimes partir des paramtres trouvs avec
le maximum de vraisemblance.

Lhypothse nulle pour le test est lhypothse selon laquelle les probabilits
que la vitesse prenne les valeurs dans les classes 1 25 proviennent dune
loi Weibull. La statistique trouve en (4.3.2) suit asymptotiquement, sous lhy-
pothse nulle et sous lhypothse que les donnes sont i.i.d., une loi du 2
25 1 2 = 22 degrs de libert. On rejettera donc lhypothse nulle si
T > 222;0,05 = 33,924 pour un test avec niveau de significativit de 5%.

On appliquera ce test pour tous les sites afin de vrifier si la modlisation de la


vitesse des vents sur toute la priode disponible, par la Weibull est approprie.
40

4.3.1.1. Rsultats

TABLEAU 4.1. Rsultats aux tests du Khi-deux

Site N10 Statistique de test Valeur-p Rejet de H0 (Oui/non)


1 444 777 6 956,84 <0,001 Oui
2 281 117 5 766,37 <0,001 Oui
3 222 688 2 553,78 <0,001 Oui
4 320 903 5 563,79 <0,001 Oui
5 49 689 230,63 <0,001 Oui
6 178 278 2 714,39 <0,001 Oui
7 261 566 51 530,94 <0,001 Oui
8 51 979 262,71 <0,001 Oui
9 275 917 4 731,91 <0,001 Oui
10 243 024 3 556,63 <0,001 Oui
11 126 242 31 377,06 <0,001 Oui
12 51 980 1 755,10 <0,001 Oui
13 195 796 1 411,86 <0,001 Oui
14 264 175 4 667,13 <0,001 Oui
15 159 580 2 096,91 <0,001 Oui
16 174 216 7 917,83 <0,001 Oui
17 53 629 1 004,43 <0,001 Oui
18 48 507 1 187,39 <0,001 Oui
19 63 246 2 033,06 <0,001 Oui
20 61 271 3 637,26 <0,001 Oui
21 116 714 765,06 <0,001 Oui
22 51 626 1 189,15 <0,001 Oui
23 118 120 7 280,38 <0,001 Oui
24 97 640 5 625,07 <0,001 Oui
25 35 758 2 428,91 <0,001 Oui
26 14 085 192,34 <0,001 Oui
27 21 289 739,56 <0,001 Oui
28 52 082 710,42 <0,001 Oui
29 83 844 2 221,16 <0,001 Oui
30 122 229 4 310,35 <0,001 Oui
31 207 621 3 211,29 <0,001 Oui

4.3.1.2. Discussion

On peut voir dans le tableau 4.1 que lhypohse nulle est largement rejete
dans tous les cas. Effectivement, rappelons que les statistiques de test prsen-
tes dans ce tableau (comprises entre 192,34 et 51 530,94) sont compares
la valeur 33,92 pour dterminer du rejet ou non de H0 . Cest donc dire quon
41

rejette lhypothse que les observations sont indpendantes et identiquement


distribues selon une Weibull dont les paramtres sont fixes sur toute la priode
et que les probabilits que la vitesse prenne les valeurs dans les classes 1 25
ne proviendraient pas dune loi Weibull paramtres fixes sur la priode, selon
ces tests. Par contre, il faut raliser quavec une taille dchantillon aussi grande
(entre 14 085 et 444 777 observations), la puissance du test est norme pour d-
tecter mme de petites diffrences. Il est aussi possible que les rejets de H0
soient dus la variabilit de la distribution de la vitesse du vent dans le temps
(par exemple, dun mois lautre ou dune anne lautre). En effet, les pa-
ramtres pourraient changer davantage dans le temps que ce quoi lon peut
sattendre en utilisant des donnes indpendantes identiquement distribues
sur toute la priode, ce que nous ne pourrions pas remarquer en ne modlisant
la distribution de la vitesse du vent que de faon globale sur tout i = 0,...,N10 .
La modlisation serait donc inadquate non pas cause de lutilisation dune
Weibull mais plutt parce quon ne considre pas la variation de la distribution
dans le temps.

4.4. VARIATION DES PARAMTRES DE LA Weibull EN FONCTION


DU TEMPS

Comme nous dsirons, entre autres, valuer lincertitude relie lestima-


tion de la production dnergie long terme, il serait intressant de porter une
attention particulire la variation des paramtres de la Weibull ajuste sur la
distribution des vitesses du vent en fonction du temps. En effet, une grande
variation des paramtres pourrait signifier que lon doive ajuster une Weibull
diffrente chaque anne ou chaque mois, puisque la distribution change trop
dans le temps, ou encore considrer une modlisation plus complexe o les pa-
ramtres pourraient changer dans le temps. Prsentement, les ingnieurs uti-
lisent une mme distribution Weibull, laquelle a t trouve en ajustant sur le
jeu de donnes de vitesses de vent aux dix minutes complet une Weibull par-
tir des estimateurs du maximum de vraisemblance des paramtres de forme
et dchelle. Voyons maintenant comment lon pourrait justifier lutilisation de
Weibull spares pour chaque anne ou chaque mois.

4.4.1. Comparaison de la variance des paramtres globaux, annuels et


mensuels

On pense que les paramtres des Weibull ajustes sur diverses annes ou
mme divers mois varient de faon assez considrable. Serait-il prfrable de
42

modliser de faon spare chaque distribution de vent annuelle ou mensuelle ?


Si nous ajustons chaque dbut de nouvelle anne des paramtres de Weibull
diffrents, on peut obtenir des estimations spares de la variance des estima-
teurs pour les paramtres. Il en va de mme pour chaque mois. On se demande
donc si les paramtres changent beaucoup chaque an/mois et si oui, cela affec-
tera certainement la variance asymptotique des paramtres. Si non, on risque
de voir des variances assez semblables dannes en annes ou de mois en mois.

Afin de vrifier si lajustement de Weibull spares est justifi, nous allons


donc comparer la variance des paramtres globaux, des paramtres provenant
de distributions annuelles et celle des paramtres provenant de distributions
mensuelles. Pour les paramtres mensuels ou annuels, on pourra calculer la
variance partir de deux estimateurs diffrents, soient la variance chantillon-
nale et la variance asymptotique estime. En ce qui concerne les paramtres
globaux, comme ils sont estims sur la distribution complte et que lon ne
possde donc quune paire de paramtres, on ne pourra questimer la variance
asymptotique.

F IGURE 4.3. Ajustements de lois Weibull pour plusieurs annes,


au site 1
43

On peut retrouver la figure 4.3 les diverses fonctions de densit des Weibull
ajustes sur les distributions de vitesse du vent annuelles au site 1, laide des
estimateurs du maximum de vraisemblance des deux paramtres. La premire
anne est lanne 2003 et la dixime, 2012.

Voyons dabord la notation utilise pour les donnes aux dix minutes regrou-
pes par mois ou par anne et pour les paramtres qui seront ajusts sur chaque
distribution annuelle ou mensuelle. Ici encore, on utilise les donnes de vitesse
du vent aux dix minutes de lanmomtre 1. On notera maintenant YAi,j,l la
donne de vitesse de vent aux dix minutes collecte durant lanne i, i = 1,...,A,
pour le j e mois de lanne i, j = 1,...,12 et pour ce mois de cette anne prcise,
durant le le dix minutes, l = 1,...,Ni,j . On comprend donc que Ni,j est le nombre
de vitesses de vent aux dix minutes collectes durant le j e mois de lanne i.

Ensuite, afin de faciliter la notation des donnes ayant t collectes durant un


mme mois, on considrera sans perte de gnralit quil y a pour chaque site
un nombre M de mois sur lesquels les vitesses aux dix minutes stendent. On
notera Mj lindice des mois lorsquon ne tient pas compte de lanne, Mj =
1,...,M . On pourra donc faire correspondre une certaine combinaison des (Ai,j )
lindice Mj et lindice des dix minutes, l = 1,...,Ni,j deviendra maintenant
l = 1,...,NMj de sorte que le nombre de donnes aux dix minutes qui soient
contenues dans le mois Mj soit maintenant not NMj .

On fait ensuite lhypothse que les YMj ,1 ,...,YMj ,NMj , i.e. les donnes aux dix
minutes collectes durant le mois Mj , sont i.i.d. et distribues selon une Wei-
bull( Mj ) ou encore, de faon quivalente, une Weibull(Mj , kMj ). On estimera
ces deux derniers paramtres partir de la mthode du maximum de vraisem-
blance, tels que vus la section 4.2, afin dobtenir Mj .

Comme on possde plusieurs estimateurs (un pour chaque mois), on peut


dabord calculer la variance chantillonnale des estimateurs. Or, si lon veut
demeurer cohrent, on doit calculer la variance chantillonnale des paramtres
de forme et dchelle multiplis par la racine du nombre dobservations, afin
de pouvoir comparer les diverses estimations de variance (entre autres parce
que les paramtres annuels ou globaux ont t ajusts sur un nombre diffrent
dobservations et que lestimation de leur variance asymptotique tient compte
du nombre dobservations ; on doit donc rajuster pour cela). De plus, si on
pense seulement aux paramtres mensuels, on fait lhypothse que les don-
nes sont i.i.d. lintrieur dun mois puisquon ajuste sur ces donnes une
distribution Weibull en croyant que chacune des vitesses de vent proviendrait
44

dune telle distribution. Puis, si les paramtres sont identiques dun mois
lautre et que la taille de lchantillon est la mme, alors les (Mj , kMj ) sont
i.i.d. Nous devons donc absolument utiliser le mme nombre dobservations
pour chaque mois o lon ajustera une Weibull aux vitesses de vent mesures,
mais chaque mois ne contient malheureusement pas le mme nombre dob-
servations cause de donnes manquantes ou du nombre de jours qui varie
entre les mois. Nous avons donc dcid de faire un tirage alatoire sans re-
mise de q vitesses de vent aux dix minutes dans chaque mois et dutiliser ces q
donnes pour lajustement des Weibull mensuelles, plutt que les NMj donnes
disponibles variant pour chaque mois. Certains des mois prsentant plusieurs
vitesses de vent manquantes, q a t dfini comme suit :
1
q = min{NMj |Mj 1,...,M et NMj > 6 24 31}.
2
Nous avons donc choisi, parmi les mois o au moins la moiti des donnes
taient disponibles, le mois o il y avait le moins de donnes de vitesses de
vent aux dix minutes disponibles. Ainsi, sans perte de gnralit, notez que
NMj = q vitesses de vent aux dix minutes ont t utilises pour lajustement de
Weibull mensuelles et pour les estimations de variance asymptotique ou chan-
tillonnale des paramtres, et que les mois o moins de q vitesses de vent ont
t mesures nont pas t pris en compte dans les calculs.

Dfinissons maintenant les variances chantillonnales que nous calculerons


pour les paramtres mensuels :
M
q X
Vech,kM = (kMj k M )2 ,
M 1 j=1
M
q X
Vech,M = (Mj M )2 ,
M 1 j=1

o
M
1 X
k M = kM et
M j=1 j
M
1 X
M = Mj .
M j=1

De plus, si q est grand, on a aussi que :


I1
!
Mj ( Mj )
Mj N Mj ,
q
45
 1 
Mj q N Mj q, IMj ( Mj )
 
N Mj q, I1
obs,Mj , o j=1,...,M,

o linformation de Fisher est dfinie de faon gnrale comme :


" #
log f (YMj ; Mj ) 2
IMj ( Mj ) = E . (4.4.1)
Mj
Linformation de Fisher observe est dnote Iobs,Mj et est obtenue partir de
IMj ( Mj ) o Mj est lestimateur du maximum de vraisemblance des para-
mtres de la Weibull Mj calcul partir de YMj le vecteur compos des ob-
servations sur lesquelles on ajuste une distribution, donc les vitesses de vent
aux dix minutes du j e mois dans notre cas. On crit donc lestimateur de la va-
riance asymptotique des paramtres mensuels (multiplis par la racine carre
de q) de la faon suivante :

\ \
Vasy,Mj = I1
obs,Mj =
Var(kMj ) Cov(kMj ,Mj )
. (4.4.2)
\
Cov( ,k ) \
Var( )
Mj Mj Mj

On utilisera en fait la moyenne des variances asymptotiques mensuelles comme


valeur de variance des paramtres mensuels comparer aux autres mesures de
variance des paramtres :
M
1 X
Vasy,M = Vasy,Mj .
M j=1

Notez que la variance ci-haut est une matrice 2x2 et que nous nutiliserons que
les entits de la diagonale, qui reprsentent respectivement les estimations de
la variance des estimateurs du paramtre k et du paramtre ayant t multi-
plis par la racine carre de q.

On fera la mme chose avec les donnes aux dix minutes de chaque anne afin
de comparer les variances chantillonnales et asymptotiques annuelles aux va-
riances mensuelles ou globales. On considre maintenant YAi ,1 ,...,YAi ,NAi o
Ai = 1,...,A est lanne sur laquelle des donnes aux dix minutes sont collectes
pour un site particulier et NAi , le nombre de vitesses de vent aux dix minutes
collectes durant lanne i, sans perte de gnralit, et on note que pour YAi ,m
la me vitesse de vent aux dix minutes rcolte durant lanne i, correspond
une combinaison des indices (j,l) de sorte que les deux notations soient qui-
valentes.
46

On fait ensuite lhypothse que les YAi ,1 ,...,YAi ,NAi , i.e. les donnes aux dix
minutes collectes durant lanne Ai , sont i.i.d. et distribues selon une Wei-
bull( Ai ) ou encore une Weibull(kAi ,Ai ). On estime ces deux paramtres par-
tir des estimateurs du maximum de vraisemblance, toujours tels que vus
la section 4.2, et lon obtient Ai . On estime dabord la variance partir de
p
la variance chantillonnale des paramtres annuels multiplis par NAi , le
nombre dobservations disponibles pour chaque anne. Or, comme dans le cas
des mois, certaines annes prsentent plusieurs donnes manquantes et nous
avons besoin destimer les paramtres sur des distributions de mme taille.
Nous avons donc dcid, ici encore, de faire un tir alatoire sans remise de p
vitesses de vent aux dix minutes dans chaque anne et dutiliser ces p don-
nes pour lajustement des Weibull annuelles, plutt que les NAi donnes dis-
ponibles. Cette fois, p a t dfini de la faon suivante :
1
p = min{NAi |Ai 1,...,A et NAi > 6 24 365}.
2
On peut donc calculer la variance chantillonnale des paramtres annuels mul-

tiplis par p de la faon suivante :
A
p X
Vech,kA = (kAi k A )2 ,
A 1 i=1
A
p X
Vech,A = (Ai A )2 ,
A 1 i=1
o
A
1X
k A = kA et
A i=1 i
A
1X
A = A .
A i=1 i

Si p est grand, on a que :


!
I1
Ai ( Ai )
Ai N Ai ,
p

Ai p N Ai p, I1

Ai ( A i
)
1 
N Ai p, Iobs,Ai , o i=1,...,A,

o on redfinit linformation de Fisher et linformation de Fisher observe de


la mme faon quen (4.4.1) et (4.4.2) mais pour les paramtres annuels. On
47

utilisera, tout comme pour la variance mensuelle, la moyenne des variances


asymptotiques annuelles comme valeur de variance asymptotique des para-
mtres annuels comparer aux autres mesures de variance des paramtres :
A
1X
Vasy,A = Vasy,Ai .
A i=1

Notez encore une fois que la variance ci-haut est une matrice 2x2 et que nous
nutiliserons que les entits de la diagonale, qui reprsentent respectivement
les estimations de la variance des estimateurs du paramtre k et du paramtre
ayant t multiplis par la racine carre de p.

Finalement, aux variances asymptotiques et chantillonnales mensuelles ou


annuelles, nous allons comparer la variance asymptotique globale estime,
soit celle des paramtres ajusts sur la distribution complte des vitesses de
vent aux dix minutes. On fait lhypothse que toutes les vitesses de vent aux
dix minutes YAi,j,l , pour Ai = 1,...,A, j = 1,...,12, l = 1,...,Ni,j , sont i.i.d. Wei-
bull(kG ,G ). On estime les deux paramtres, toujours partir des estimateurs
du maximum de vraisemblance, et lon obtient G . On fait encore une fois lhy-
pothse de normalit suivante pour les paramtres de la distribution globale :
I1
 
G ( G )
G N G ,
N10 + 1
p  p 
G N10 + 1 N G N10 + 1, I1 G ( G )
 p 
N G N10 + 1, I1 obs,G ,

o linformation de Fisher globale et linformation de Fisher observe globale


sont toujours dfinies de la mme faon que prcdemment mais YG devient
le vecteur compos de toutes les vitesses de vent aux dix minutes quon a pu
collecter lanmomtre 1. On crit donc lestimateur de la variance asympto-
tique des paramtres globaux de la faon suivante :

\ \
Vasy,G = I1
obs,G =
Var(kG ) Cov(kG ,G )
,
\
Cov( ,k ) \
Var( )
G G G

o lon utilise encore une fois les entits de la diagonale comme estimations de
la variance.

On obtient donc finalement cinq mesures de la variance pour chaque para-


mtre, soient les lments en premire ligne et premire colonne des matrices

Vasy,G , Vasy,A , Vasy,M , ainsi que les mesures Vech,kA et Vech,kM pour la variance
48

de k et les lments en dernire ligne et dernire colonne des matrices Vasy,G ,



Vasy,A , Vasy,M , ainsi que les valeurs de Vech,A et Vech,M pour la variance de .
Les tableaux suivants prsentent la comparaison des variances pour chaque
site, de faon spare pour chaque paramtre.

4.4.1.1. Rsultats

TABLEAU 4.2. Comparaison des diverses mesures de variance


du paramtre de forme k

1
Site p (ans) q (mois) Vasy,G Vasy,A Vasy,M Vech,k
Vech,kM
A

1 24 869 2 383 3,46 3,52 4,37 363,89 240,31


2 26 052 2 549 1,45 1,49 1,81 152,11 238,73
3 13 753 3 900 2,95 2,95 3,51 51,78 273,92
4 31 524 2 346 3,12 3,17 3,89 258,55 239,76
5 5 986 2 376 2,88 3,80 4,12 355,35 243,24
6 43 245 2 367 3,60 3,73 4,50 541,94 169,42
7 14 974 2 352 3,37 3,44 4,30 237,36 297,18
8 9 085 3 765 2,96 3,26 3,38 263,44 266,33
9 25 850 3 243 3,07 3,09 3,79 144,39 302,96
10 13 324 3 378 3,60 3,82 4,62 197,68 419,13
11 14 865 3 594 5,05 4,89 6,19 1338,85 987,30
12 4 240 3 796 3,95 4,85 5,05 422,92 392,35
13 35 148 3 281 1,80 1,80 2,19 546,99 341,60
14 15 096 2 372 2,07 2,12 3,06 59,99 372,67
15 16 731 2 526 2,78 2,82 3,33 130,63 189,72
16 27 375 2 958 2,67 2,69 3,29 91,52 134,10
17 24 572 2 664 1,76 1,80 2,17 5,64 40,77
18 14 591 2 310 3,70 4,01 5,31 377,87 345,36
19 24 048 3 918 2,03 2,06 2,53 17,96 672,57
20 21 888 4 104 2,36 2,41 3,06 22,70 659,31
21 24 934 4 310 2,42 2,53 3,19 476,29 101,76
22 19 378 2 862 2,56 2,79 3,27 1 303,42 212,57
23 19 416 2 446 2,85 2,93 3,22 121,39 167,41
24 16 674 2 697 4,15 4,58 5,05 1 459,22 441,34
25 9 519 4 011 2,13 2,46 3,21 1 050,07 283,70
26 14 085 4 120 2,21 2,21 2,65 - 86,23
27 21 289 2 649 2,29 2,29 2,48 - 44,85
28 12 594 3 941 2,62 2,92 3,15 541,29 230,88
29 10 944 2 448 3,55 4,00 4,71 46,79 165,37
30 29 423 2 314 2,79 2,78 3,78 206,07 171,42
31 25 339 2 508 2,15 2,19 2,63 109,79 146,26
1
Les cases vides sont les sites o il ny a pas assez dobservations pour obtenir une variation annuelle.
49

TABLEAU 4.3. Comparaison des diverses mesures de variance


du paramtre dchelle

1
Site p (ans) q (mois) Vasy,G Vasy,A Vasy,M Vech,
Vech,M
A

1 24 869 2 383 12,04 11,97 12,03 1 201,59 1 791,02


2 26 052 2 549 37,61 37,36 34,59 9 353,24 8 456,28
3 13 753 3 900 15,16 15,46 13,93 1 287,72 4 657,65
4 31 524 2 346 11,48 11,32 11,42 1 765,99 1 636,82
5 5 986 2 376 15,50 14,35 15,53 1 804,03 4 864,89
6 43 245 2 367 11,17 10,67 11,17 380,03 1 064,72
7 14 974 2 352 9,18 9,23 8,49 1 712,51 1 609,66
8 9 085 3 765 16,96 15,40 16,81 567,33 2 724,53
9 25 850 3 243 16,60 16,53 15,65 1 392,49 3 191,62
10 13 324 3 378 14,68 14,50 12,79 4 636,30 5 784,21
11 14 865 3 594 9,06 9,20 8,36 4 119,81 24 00,78
12 4 240 3 796 7,86 6,96 6,96 446,14 3 217,10
13 35 148 3 281 24,20 24,02 22,23 13 121,06 6 306,30
14 15 096 2 372 34,17 34,46 28,06 6 703,15 15 636,58
15 16 731 2 526 17,28 17,51 16,79 3 521,49 2 046,93
16 27 375 2 958 10,98 10,99 10,03 751,75 2 788,72
17 24 572 2 664 10,33 10,31 9,30 7 907,32 2 945,67
18 14 591 2 310 15,89 15,09 17,14 16 330,78 377,87
19 24 048 3 918 13,92 14,08 13,48 5 030,83 2 463,52
20 21 888 4 104 12,92 13,11 12,23 5 978,81 2 858,05
21 24 934 4 310 27,21 25,80 24,33 13 871,73 6 560,63
22 19 378 2 862 17,39 16,79 16,30 4 050,34 3 390,51
23 19 416 2 446 16,75 16,44 18,26 145,22 575,92
24 16 674 2 697 11,23 10,76 11,81 33,70 967,63
25 9 519 4 011 21,62 20,61 17,95 16 200,89 13 982,28
26 14 085 4 120 35,42 35,42 31,14 - 16 113,60
27 21 289 2 649 35,43 35,43 32,89 - 6 129,90
28 12 594 3 941 23,06 22,68 21,61 13 283,79 5 596,19
29 10 944 2 448 11,27 11,03 10,01 1 980,34 2 347,37
30 29 423 2 314 14,80 14,83 15,13 1 015,86 2 285,58
31 25 339 2 508 11,00 10,79 10,65 338,92 1 820,69
1
Les cases vides sont les sites o il ny a pas assez dobservations pour obtenir une variation annuelle.

4.4.1.2. Discussion

Suite aux rsultats obtenus aux tests du Khi-deux prcdemment, on pense


que la distribution de la vitesse du vent serait trop variable dans le temps pour
ntre modlise que de faon globale. On a donc voulu comparer diverses me-
sures de variance afin de vrifier si les paramtres annuels ou mensuels varient
50

davantage que ce quoi lon pourrait sattendre en se basant sur la variance de


ces mmes paramtres pour la distribution globale. En regardant les tableaux
4.2 et 4.3, on a pu voir tant pour le paramtre de forme que dchelle, que la
variance chantillonnale explose par rapport aux variances asymptotiques es-
times. De plus, les variances asymptotiques globales, annuelles et mensuelles
sont toutes assez semblables alors que la diffrence entre les variances chan-
tillonnales annuelles et mensuelles est davantage marque.

Ainsi, comme on voit une grosse diffrence entre les variances chantillonnales
et asymptotiques, on se demande maintenant si cela peut rellement nous per-
mettre de conclure que les paramtres varient de faon considrable (trop pour
najuster quune seule Weibull sur la distribution de la vitesse du vent) ou sil
ny a pas une autre raison qui nous chappe, qui mnerait de tels rsultats,
aussi diffrents entre les estimateurs de la variance. Prenons par exemple le
site 1, o la variance asymptotique du paramtre de forme annuel multipli
par la racine de p est denviron 3 et la variance chantillonnale du paramtre
de forme annuel multipli par la racine de p, plutt de lordre de 300 (et on
trouve peu prs le mme rapport pour les variances du paramtre dchelle
ce site). Comme on a utilis partout le mme nombre dobservations pour
lajustement dune Weibull (p dans le cas des paramtres annuels), on voit que
mme en prenant lchelle originale et en divisant par p les variances obtenues,
on obtient des variances chantillonnales et asymptotiques pour k de lordre
de 300
p
et p3 respectivement, qui sont toujours trs diffrentes. On se demande
donc si cette diffrence est trop importante pour quil ne sagisse que de la va-
riabilit des paramtres dans le temps, et si cela pourrait tre d la prsence
de dpendance entre les observations, menant des estimateurs qui seraient
davantage variables. Effectivement, lon pourrait peut-tre sattendre des va-
riances trs diffrentes dans le cas o lon estimerait la variance de paramtres
ajusts sur une distribution de donnes dpendantes par rapport indpen-
dantes, mais il ne sagit que dune hypothse pour le moment. Pour vrifier
cette hypothse ainsi que celle que les paramtres varient trop pour nutiliser
que des paramtres globaux, nous allons donc faire une simulation partir du
bootstrap et des paramtres ajusts sur la distribution globale de la vitesse du
vent, ainsi que les paramtres annuels et mensuels. Nous allons donc utiliser
des donnes indpendantes entre elles, gnres sous des modles prcis se-
lon lhypothse tester : notre hypothse nulle sera que la distribution du vent
devrait tre modlise par une Weibull avec paramtres globaux sur toute la
51

priode (et donc que des paramtres globaux suffiraient lors de la modlisa-
tion). En ce qui a trait aux hypothse alternatives, on aura dans un premier
temps (premire hypothse alternative) que la distribution pourrait plutt tre
dcompose en plusieurs distributions annuelles de la vitesse de vent qui pro-
viennent chacune dune Weibull diffrente. La deuxime hypothse alternative
sera plutt que la distribution sur neuf ans peut tre dcompose en 108 dis-
tributions mensuelles (neuf annes multiplies par douze mois) qui provien-
draient toutes de Weibull avec des paramtres diffrents. Pour voir quels r-
sultats mnerait lhypothse nulle (en faisant aussi lhypothse que les donnes
sont indpendantes), nous allons procder comme suit :

Algorithme pour la variance sous H0

Rappelons que nous avons utilis q=2 383 donnes par mois, p=24 869 donnes
par anne et 444 777 donnes au total au site 1 pour nos ajustements de Wei-
bull (voir tableau 4.2). Sous H0 , on utilise les paramtres globaux kG , G ajusts
prcdemment au site 1 :
(1) Simulation dun jeu de donnes i.i.d de taille 444 777 partir dune
W eibull(kG ,G )
(2) Ajustement de paramtres globaux sur les donnes simules en (1) et
estimation de leur variance asymptotique
(3) Sparation des 444 777 donnes en neuf annes et utilisation de seule-
ment p=24 869 donnes par anne (choisies de faon alatoire dans les
444 777/949 420 donnes par anne disponibles)
(4) Ajustement de paramtres annuels sur chacune de ces distributions an-
nuelles de p donnes et estimation de la variance chantillonnale des
neuf paramtres dchelle et des neuf paramtres de forme, ainsi que
de la variance asymptotique (moyenne des variances asymptotiques de
chacun des neuf paramtres dchelle et de forme)
(5) Sparation des 444 777 donnes en 108 mois et utilisation de seule-
ment q=2 383 donnes par mois (choisies de faon alatoire dans les
444 777/1084 118 donnes disponibles pour chaque mois)
(6) Ajustement de paramtres mensuels sur chacune de ces distributions
mensuelles de q donnes et estimation de la variance chantillonnale
des 108 paramtres dchelle et de forme ainsi que de la variance asymp-
totique (moyenne des variances asymptotiques de chacun des 108 pa-
ramtres dchelle et de forme)
52

(7) Reproduire les tapes (1) (6) 1 000 fois pour obtenir 1 000 valeurs
de variance asymptotique globale, annuelle et mensuelle et le mme
nombre de valeurs de variance chantillonnale annuelle et mensuelle,
et ce pour chacun des deux paramtres dune Weibull

Nous obtenons donc 1 000 variances asymptotiques globales, annuelles, men-


suelles et 1 000 variances chantillonnales annuelles et mensuelles sous lhypo-
thse nulle, pour chacun des paramtres. Pour cette hypothse, nous ne pr-
sentons pas les rsultats puisque nous avons obtenu, dans tous les cas, des
rsultats trs similaires ceux obtenus dans les tableaux 4.2 et 4.3 pour la va-
riance asymptotique globale, annuelle et mensuelle des paramtres (cest--
dire des variances tant asymptotiques quchantillonnales tournant autour de
3,5 pour le paramtre de forme et de 12,0 pour le paramtre dchelle). Ainsi,
en ce qui a trait aux variances asymptotiques, on ne peut pas dire que H0 ne
soit pas plausible. Par contre on voit que les variances chantillonnales (tant
annuelles que mensuelles) obtenues en 4.2 et en 4.3 sont trs diffrentes des va-
leurs obtenues par simulation. Dans les simulations, les variances chantillon-
nales tant annuelles que mensuelles sont en moyenne proches des variances
asymptotiques. Allons donc voir plus loin, partir des simulations bases sur
les hypothses alternatives, si lon nobtiendrait pas des valeurs similaires
celles trouves avec les vraies valeurs de vitesse de vent.

Algorithme pour la variance sous HA,1

Rappelons encore que nous avons utilis q=2 383 donnes par mois, p=24 869
donnes par anne et 444 777 donnes au total au site 1. Sous HA,1 , on utilise
les paramtres annuels kAi ,Ai , i=1,...,9 ajusts prcdemment au site 1 :
(1) Simulation dun jeu de donnes de taille 444 777 partir de 444 777/9
49 420 donnes simules de chacune des distributions Weibull( kAi ,Ai ),
i=1,...,9, mises bout bout.
(2) Ajustement de paramtres globaux sur toute la distribution de 444 777
donnes cre en (1) et estimation de leur variance asymptotique
(3) Sparation des 444 777 donnes en neuf annes et utilisation de seule-
ment p=24 869 donnes par anne (choisies de faon alatoire dans les
49 420 donnes disponibles)
(4) Ajustement de paramtres annuels sur chacune de ces distributions an-
nuelles de p donnes et estimation de la variance chantillonnale des
neuf paramtres dchelle et des neuf paramtres de forme, ainsi que
53

de la variance asymptotique (moyenne des variances asymptotiques de


chacun des neuf paramtres dchelle et de forme)
(5) Sparation des 444 777 donnes en 108 mois et utilisation de seulement
q=2 383 donnes par mois (choisies de faon alatoire dans les 4 118
donnes disponibles pour chaque mois)
(6) Ajustement de paramtres mensuels sur chacune de ces distributions
mensuelles de q donnes et estimation de la variance chantillonnale
des 108 paramtres dchelle et de forme ainsi que de la variance asymp-
totique (moyenne des variances asymptotiques de chacun des 108 pa-
ramtres dchelle et de forme)
(7) Reproduire les tapes (1) (6) 1 000 de fois pour obtenir 1 000 valeurs
de variance asymptotique globale, annuelle et mensuelle et le mme
nombre de valeurs de variance chantillonnale annuelle et mensuelle,
et ce pour chacun des deux paramtres dune Weibull

Ici, il est intressant de prsenter la distribution des variances chantillonnales


annuelles et mensuelles. En effet, la distribution des variances asymptotiques
globales, annuelles et mensuelles est demeure semblable celle sous H0 , cest-
-dire que les distributions tournent encore autour de 3,5 pour le paramtre de
forme et de 12,0 pour le paramtre dchelle. On prsente donc la figure 4.4 la
distribution des variances chantillonnales annuelles et mensuelles sous HA,1 ,
pour chacun des paramtres, ainsi que les valeurs trouves partir des don-
nes relles dans les tableaux 4.2 et 4.3 (reprsentes sous forme de barres ver-
ticales pointilles sur les histogrammes en 4.4). On voit bien que pour les para-
mtres annuels, les variances chantillonnales sont, pour les deux paramtres,
assez prs de celles obtenues partir des donnes relles. Les valeurs relles
sont mme contenues dans les distributions obtenues partir du bootstrap.
Par contre, pour les distributions de variances chantillonnales mensuelles, les
valeurs obtenues plus tt et prsentes dans les tableaux 4.2 et 4.3 taient beau-
coup plus grandes que les valeurs obtenues par bootstrap. Les valeurs relles
ne sont pas contenues dans les distributions, pour les deux paramtres, et cela
semble indiquer que la variance chantillonnale de nos paramtres est plus
grande que ce quon pourrait trouver si des paramtres changeant annuelle-
ment suffisaient lors de lajustement de Weibull sur la distribution de la vitesse
du vent.

Comme on vient de voir que dajuster des Weibull diffrentes chaque anne
ne mne toujours pas des variances mensuelles des paramtres aussi grandes
54

Forme annuelle chantillonnale Forme mensuelle chantillonnale


300

200
250
200

150
Frquence

Frquence
150

100
100

50
50
0

0
300 350 400 450 30 35 40 45 50

Valeur dans l'chantillon: 363,89 Valeur dans l'chantillon: 240,31

chelle annuelle chantillonnale chelle mensuelle chantillonnale


200

150
150
Frquence

Frquence

100
100

50
50
0

1000 1200 1400 1600 100 120 140 160

Valeur dans l'chantillon: 1201,59 Valeur dans l'chantillon: 1791,02

F IGURE 4.4. Distributions des 1 000 variances chantillonnales


annuelles et mensuelles pour les deux paramtres de Weibull,
provenant des ajustements sur des distributions simules boots-
trap partir de paramtres annuels

que celles observes, on veut aussi tester lhypothse alternative 2, cest--dire


des paramtres diffrents devraient tre ajusts sur chacune des distributions
mensuelles de vitesses du vent. Pour ce faire, nous prsentons maintenant lal-
gorithme de simulation utilis pour vrifier si les variances obtenues sous cette
55

hypothse (en faisant encore lhypothse que les donnes sont indpendantes)
sont reprsentatives de ce quon a observ.

Algorithme pour la variance sous HA,2

Rappelons toujours que nous avons utilis q=2 383 donnes par mois, p=24 869
donnes par anne et 444 777 donnes au total au site 1. Sous HA,2 , on utilise
les paramtres mensuels kMj ,Mj , j=1,...,108 ajusts prcdemment au site 1 :
(1) Simulation dun jeu de donnes de taille 444 777 partir de 444 777/108
4 118 donnes simules de chacune des distributions Weibull( kMj ,Mj ),
j=1,...,108, mises bout bout.
(2) Ajustement de paramtres globaux sur toute la distribution de 444 777
donnes cre en (1) et estimation de leur variance asymptotique
(3) Sparation des 444 777 donnes en neuf annes et utilisation de seule-
ment p=24 869 donnes par anne (choisies de faon alatoire parmi les
49 420 donnes disponibles pour chaque anne)
(4) Ajustement de paramtres annuels sur chacune de ces distributions an-
nuelles de p donnes et estimation de la variance chantillonnale des
neuf paramtres dchelle et des neuf paramtres de forme, ainsi que
de la variance asymptotique (moyenne des variances asymptotiques de
chacun des neuf paramtres dchelle et de forme)
(5) Sparation des 444 777 donnes en 108 mois et utilisation de seulement
q=2 383 donnes par mois (choisies de faon alatoire parmi les 4 118
donnes disponibles pour chaque mois)
(6) Ajustement de paramtres mensuels sur chacune de ces distributions
mensuelles de q donnes et estimation de la variance chantillonnale
des 108 paramtres dchelle et de forme ainsi que de la variance asymp-
totique (moyenne des variances asymptotiques de chacun des 108 pa-
ramtres dchelle et de forme)
(7) Reproduire les tapes (1) (6) 1 000 fois pour obtenir 1 000 valeurs
de variance asymptotique globale, annuelle et mensuelle et le mme
nombre de valeurs de variance chantillonnale annuelle et mensuelle,
et ce pour chacun des deux paramtres dune Weibull

Dans le cas de lhypothse alternative 2, on obtient encore des distributions des


variances asymptotiques tournant autour de 3,5 pour le paramtre de forme et
de 12,0 pour le paramtre dchelle, et les estimateurs de la variance asymp-
totique obtenus dans les tableaux 4.2 et 4.3 sont contenus (ou trs prs dtre
56

contenus) dans les distributions des 1 000 variances trouves par simulations.
Or, en ce qui concerne les distributions des variances chantillonnales, on ob-
tient plutt les rsultats prsents la figure 4.5.

Forme annuelle chantillonnale Forme mensuelle chantillonnale

300
400

250
200
300
Frequency

Frequency

150
200

100
100

50
0

100 200 300 400 500 230 240 250 260 270

Valeur dans l'chantillon: 363,89 Valeur dans l'chantillon: 240,31

chelle annuelle chantillonnale chelle mensuelle chantillonnale


300
500

250
400

200
Frequency

Frequency
300

150
200

100
100

50
0

500 1000 1500 2000 1750 1800 1850 1900

Valeur dans l'chantillon: 1201,59 Valeur dans l'chantillon: 1791,02

F IGURE 4.5. Distributions des 1 000 variances chantillonnales


annuelles et mensuelles pour les deux paramtres de Weibull,
provenant des ajustements sur des distributions simules boots-
trap partir de paramtres mensuels
57

On voit maintenant que les valeurs obtenues plus tt (barres pointilles dans
le graphique) sont contenues dans les distributions, tant pour la distribution
des variances des paramtres annuels que mensuels. Cela indique donc que,
mme en simulant des donnes indpendantes, mais partir de distributions
diffrentes chaque mois, on obtient des valeurs pour les variances qui sont si-
milaires ce quon a obtenu dans la ralit. Ainsi, sil y a de la dpendance
entre les observations, ce ne serait peut-tre pas la cause des variances chan-
tillonnales si diffrentes des variances asymptotiques (environ cent fois plus
grandes).

On pense plutt que des paramtres globaux, dans un premier temps, ne per-
mettent pas de capturer la variabilit dans la distribution de la vitesse de vent,
dans le temps. Dans un deuxime temps, on a remarqu partir des rsul-
tats sous lhypothse HA,1 que des paramtres annuels ne sembleraient pas
non plus capturer toute la variabilit de la distribution de la vitesse du vent
et que cette distribution varie encore davantage quaux annes, puisque les
variances chantillonnales mensuelles obtenues pour chacun des paramtres,
partir des vraies donnes, taient respectivement de 240,31 et 1 791,02 alors
quon obtenait des variances moyennes de 41,01 et 134,70 respectivement, sous
HA,1 . Aprs avoir vu la figure 4.5 que des paramtres variant mensuellement
mnent des rsultats assez prs de ceux obtenus partir des donnes me-
sures, on pense quil est possible que des paramtres changs chaque mois
mnent une meilleure modlisation de la distribution de la vitesse du vent.
Bien sr, il nous est impossible, juste avec ces rsultats, de nous assurer que
de tels paramtres variant mensuellement reprsentent la solution tout pro-
blme de modlisation. Nous pensons aussi quil existe de la dpendance entre
les observations, puisque la vitesse du vent un moment prcis sera probable-
ment plus semblable celle une heure plus tard qu la vitesse du vent une
anne plus tard, donc il est possible que les simulations ne soit pas reprsen-
tatives de la ralit puisque les donnes simules taient indpendantes et fai-
saient donc abstraction de la structure de corrlation entre les observations.
Cest pourquoi nous voulons investiguer davantage sur la dpendance entre
les observations.

4.4.2. La dpendance entre les observations

Jusqu maintenant, nous avons trait les observations de vitesse du vent


comme indpendantes. Or, de faon logique, on peut sattendre ce que la s-
rie des vitesses de vent chacun des sites soit compose dobservations qui
58

sont dpendantes entre elles, jusqu un certain dlai dans le temps. En effet,
si lon mesure la vitesse du vent aujourdhui un site particulier, et quon re-
tourne la mesurer une heure plus tard, on sattend ce que la vitesse nait pas
chang drastiquement sous des conditions mtorologiques plutt normales.
Par contre, il est possible que si lon retourne mesurer la vitesse du vent dans
plusieurs mois au mme site, la tendance du vent ait beaucoup chang et que
la vitesse ne soit plus autant relie aux mesures prises aujourdhui. Le temps
durant lequel il y a encore un lien (de la dpendance) entre les observations de
vitesse du vent est ce que nous aimerions tudier dans cette section.

Pour tudier la dpendance, nous utilisons la srie des vitesses de vent au site
1. Nous utilisons aussi un outil trs utile quand vient le temps danalyser des
sries chronologiques : un graphique dautocorrlation. Celui-ci nous permet-
tra de vrifier, pour ce site, jusqu quel dlai de temps (en heures, puis en
jours) la srie de vitesses du vent est-elle encore corrle. Chaque barre pr-
sente dans les graphiques nous indiquera la corrlation (un indice contenu
entre -1 et 1), pour diffrents dlais. Notez que la srie de vitesses de vent est
plutt stationnaire, elle ne prsente pas de tendance particulire dans le temps
et les vitesses de vent oscillent plutt autour de la moyenne long terme. Nous
avons donc utilis directement la srie des vitesses moyennes aux heures ou
aux jours sans y appliquer de transformation.
1.0

1.0
0.8

0.8
0.6

0.6
Corrlation

Corrlation
0.4

0.4
0.2

0.2
0.0

0.0

0 400 800 1200 0 20 40 60 80 100

Temps (heures) Temps (heures)

F IGURE 4.6. Graphique dautocorrlation de la srie des vitesses


de vent moyennes aux heures, au site 1
59

1.0
0.8
0.6
Corrlation

0.4
0.2
0.0

0 10 20 30 40 50 60

Temps (jours)

F IGURE 4.7. Graphique dautocorrlation de la srie des vitesses


de vent moyennes aux jours, au site 1

En ce qui a trait la corrlation entre les vitesses aux heures, on voit droite
de la figure 4.6 que la corrlation est bien prsente, au moins jusquau dlai
100 (prs de quatre jours). Si on regarde la figure 4.7, on peut aussi voir que la
corrlation entre les vitesses moyennes aux jours est significative sur un dlai
de plus de quatre jours (elle oscille ensuite autour de 0). Ces rsultats nous
aident mieux comprendre la structure de corrlation entre les observations.
De plus, cela va dans le mme sens que ce que lon croyait, cest--dire quil
existe bien de la dpendance entre les observations.

Comme nous venons de voir quil existe une dpendance non ngligeable sur
un dlai denviron trois quatre jours, nous aimerions maintenant reproduire
le test du khi-deux de la section 4.3.1 en utilisant la moyenne des vitesses de
vent sur trois jours plutt que les vitesses de vent aux 10 minutes comme en
4.3.1, pour quelques sites. Nous croyons que leffet de la dpendance entre les
observations sera amoindri en utilisant les moyennes et que les rsultats du test
pourraient maintenant tre plus fiables. Il sera intressant de remarquer si les
rsultats sont diffrents de ce quon avait avec les donnes aux dix minutes,
et si la Weibull semble maintenant approprie pour modliser la distribution
de la vitesse du vent. Nous avons donc refait le test partir des observations
moyennes aux trois jours de quelques-uns des sites prsentant des nombres
dobservations variables. Aux sites 18, 24, 25 et 26, lhypothse nulle na pas
t rejete pour des nombres dobservations aux trois jours allant de 32 226
60

(valeurs-p respectives de 0,996, 0,304, 0,348 et 0,921). Par contre, pour les sites
1, 15 et 30, on rejetait lhypothse nulle du test (valeurs-p<0,001) pour 1029, 369
et 282 observations, respectivement. Il est donc possible quon ne dtecte pas
la diffrence entre la densit de Weibull et la probabilit empirique dtre dans
chaque catgorie cause dun trop petit nombre dobservations moyennes aux
trois jours, pour les premiers sites. On pense donc toujours que la Weibull nest
pas compltement approprie pour modliser la distribution du vent, mme
en supprimant une portion de la dpendance entre les observations.

4.5. C OMPARAISON DU CALCUL DE L NERGIE ESTIME PARTIR


DE LA DISTRIBUTION EXPRIMENTALE ET DE L AJUSTEMENT
DE W EIBULL GLOBALE

Gnralement, le calcul de la production dnergie estime est fait partir


des paramtres de la Weibull ajuste sur la distribution des vitesses du vent
et dune courbe de puissance fournie par les fabricants de turbines oliennes.
La courbe de puissance est en fait un graphe qui reprsente la puissance de
sortie dune olienne diffrentes vitesses de vent. On retrouve la figure 4.8
la courbe de puissance discrtise en intervalles de 1 m/s utilise dans ce m-
moire, relie une turbine olienne classique installe par la compagnie Hatch,
soit la turbine Enercon E-82 E2. Remarquez que la puissance devient nulle
partir dune vitesse de plus de 25 m/s. Cela est d au fait que les vitesses
suprieures 25 m/s deviennent dangereuses pour la turbine et quil est pr-
frable darrter les turbines oliennes partir dune telle vitesse, afin dviter
les bris de matriel.
61

2000
1500
Puissance en kW

1000
500
0

0 5 10 15 20 25

Vitesse du vent en m/s

F IGURE 4.8. Courbe de puissance de la turbine olienne E-82 E2

Le calcul de lestimation de la production dnergie en kW pour le nombre


dheures dans une anne (donc kW/an) partir de la courbe de puissance et
des paramtres de la Weibull se fait de la faon suivante :
25
X
P rod1 = puisj P (puisj ) 365,25 24
j=1

25
" k  k !#
X j1 j
= puisj exp exp 365,25 24 (4.5.1)
j=1

dans le cas o lon utilise les probabilits estimes dtre dans chaque classe.
Les valeurs puisj sont donnes sur la figure 4.8 ; il sagit de la puissance corres-
pondant la classe j, en kilowatts. Notez que le calcul sarrte pour la classe
de vitesse du vent 24-25 m/s puisque la puissance devient nulle aprs 25 m/s
et que le reste (les vitesses de vent suprieures 25 m/s) nest donc pas comp-
tabilis dans la somme. Par contre, la Weibull est bel et bien ajuste sur la dis-
tribution de toutes les vitesses de vent car la probabilit dtre dans chaque
62

classe se doit de tenir compte des vitesses suprieures 25 m/s. On multiplie


ainsi chaque probabilit dtre dans un intervalle (par exemple, 0-1 m/s) par
la puissance respective produite par cette catgorie de vitesse de vent, puis par
le nombre dheures prsentes dans une anne afin dobtenir une estimation de
la production dnergie sur une anne complte en kW (donc en kW/an, qui-
valent kW/h multipli par le nombre dheures dans une anne).

Notez quil est aussi possible dutiliser la fonction de rpartition exprimentale


de la distribution de la vitesse du vent mesure plutt que dutiliser la fonction
de densit de la Weibull ajuste. Dans ce cas, la formule pour lestimation de la
production dnergie en kW/an devient :
25
X nj
P rod2 = puisj 365,25 24,
j=1
N10

o nj reprsente le nombre dobservations de vitesse du vent aux dix minutes


dans la classe j (j=1,...,25), la classe j=1 reprsentant des vitesses qui vont de 0
1 m/s et la classe j=25 reprsentant des vitesses allant de 24 25 m/s cette fois,
puisque la puissance devient nulle aprs. Le dnominateur ici se doit dtre le
nombre total de vitesses de vent aux dix minutes, afin de pouvoir comparer
la fraction obtenue ici (nj /N10 ) la probabilit obtenue partir de la Weibull
ajuste plus tt sur toute la distribution des observations aux dix minutes. On
pense que le fait dutiliser la distribution exprimentale peut nous donner une
ide de lampleur de la diffrence entre lestimation de la Weibull et la ralit.
On peut donc utiliser la distribution exprimentale dans le calcul de la pro-
duction dnergie estime pour se donner une valeur de rfrence laquelle
comparer lestimation faite partir de la Weibull. Le tableau 4.4 prsente, pour
chaque site tudi, la production dnergie estime partir de lajustement de
densit de Weibull et la production dnergie estime partir des frquences de
vent exprimentales. Les paramtres k et utiliss dans le calcul de la produc-
tion dnergie estime partir de la Weibull (4.5.1) sont ceux calculs partir
de la distribution globale de la vitesse du vent aux dix minutes (kG et G ).
63

4.5.1. Rsultats

TABLEAU 4.4. Comparaison des estimations de la production


dnergie annuelle faites partir de la densit Weibull ajuste ou
des frquences empiriques de la distribution des vitesses de vent
Weibull annuelles

Site N10 Estimation de la production dnergie (kW/an) Erreur relative p/r


partir de la Weibull partir des frquences frquences (%)
1 444 777 7 505 120 7 397 724 1,45
2 281 117 8 419 031 8 866 938 -5,05
3 222 688 7 954 900 7 900 730 0,69
4 320 903 6 526 109 6 380 852 2,28
5 49 689 7 893 300 7 812 491 1,03
6 178 278 7 224 776 7 131 771 1,30
7 261 566 5 800 907 5 546 591 4,59
8 51 979 8 522 101 8 589 171 -0,78
9 275 917 9 012 572 8 925 977 0,97
10 243 024 9 279 775 9 236 803 0,47
11 126 242 7 967 984 8 015 773 -0,60
12 51 983 5 543 743 5 408 930 2,49
13 195 796 7 557 156 7 611 996 -0,72
14 264 175 10 157 508 10 452 137 -2,82
15 159 580 8 447 073 8 354 194 1,11
16 174 216 5 422 102 5 228 319 3,71
17 53 629 3 465 501 3 377 229 2,61
18 48 507 9 616 664 9 855 781 -2,43
19 63 246 5 358 472 5 120 893 4,64
20 61 271 5 903 203 5 903 203 6,28
21 116 714 10 354 168 10 286 547 0,66
22 51 626 8 079 849 7 870 135 2,66
23 118 120 7 793 500 8 170 885 -4,62
24 97 640 8 438 529 8 371 262 0,80
25 35 758 8 677 819 8 170 706 6,21
26 14 085 11 311 648 11 055 074 2,32
27 21 289 11 471 330 11 064 096 3,68
28 52 082 9 999 613 9 836 322 1,66
29 83 844 7 586 470 7 561 606 0,33
30 122 229 7 562 620 7 430 818 1,77
31 207 621 4 284 831 4 192 896 2,19
64

4.5.2. Discussion

On remarque en regardant le tableau 4.4 que lerreur relative entre les deux
estimations de production dnergie oscille entre 5,05% et 6,28%. De plus,
pour 7 des 31 sites, lerreur relative est ngative et lestimation partir de la
Weibull sous-estime la production dnergie calcule partir des frquences
relles. Pour 24 des 31 sites, lestimation par la Weibull reprsente donc une sur-
estimation de la production dnergie annuelle trouve partir des frquences
relles de la vitesse du vent mesure au site. Si on tient plutt compte de ler-
reur relative absolue (la dernire colonne du tableau ci-dessus en absolu), on
trouve une moyenne derreur relative de 2,35%, avec cart-type de 1,72. La
diffrence entre les deux mthodes est donc plutt considrable (on parle de
dizaines et de centaines de milliers de kW/an de diffrence), et il pourrait tre
prfrable destimer la production dnergie annuelle toujours partir de la
distribution empirique, puisque celle-ci devrait mieux reprsenter la distribu-
tion du vent annuelle que la distribution de la Weibull ajuste sur les vitesses
de vent, dautant plus que lutilisation de la Weibull mne une sur-estimation
de la production dnergie dans la majorit des cas (menant du mme coup
un dficit dnergie par rapport aux attentes pour un site particulier).

4.6. C ONCLUSION SUR LA MODLISATION DE LA VITESSE DU VENT


De faon globale, les tests que nous avons faits dans ce chapitre nous ont
point un problme par rapport la modlisation de la vitesse du vent. En
effet, la distribution globale de la vitesse du vent (celle de toutes les vitesses
disponibles mesures un site) ne semble pas tre bien modlise par une
seule distribution Weibull si lon se base sur les tests du Khi-deux faits dans
ce chapitre. Rappelons-nous que que les rsultats obtenus aux tests du Khi-
deux taient, selon nous, srement ds la trs grande puissance du test,
lorsquautant de donnes appartiennent la distribution modlise. Or, si les
observations sont dpendantes entre elles pour un certain dlai de temps, ce
qui semble tre le cas selon les rsultats en section 4.4.2, cette puissance est
moindre et il devient difficile de dterminer si la Weibull est inapproprie pour
modliser la distribution de la vitesse du vent ou si ce nest que question de
puissance.

Nous avons aussi pens que lutilisation de paramtres de Weibull variant dans
le temps pourrait permettre de pallier la mauvaise modlisation de la distri-
bution de vitesses de vent. La comparaison des variances des paramtres
65

celles obtenues lors de simulations avec des paramtres globaux, annuels ou


mensuels nous a permis de voir quavec une distribution de vitesses du vent
pouvant tre bien modlise par une seule Weibull, nous obtiendrions des va-
riances des paramtres bien diffrentes de celles observes. La comparaison
nous a aussi permis de voir que mme en utilisant des distributions diffrentes
chaque anne, nous obtiendrions des variances mensuelles chantillonnales
encore beaucoup plus petites que celles que nous avons observes. Il semble
que les paramtres ajusts chaque mois fassent un peu mieux. De plus, ltude
de la variance des paramtres nous a permis de trouver que les diffrences
observes entre les variances asymptotiques et chantillonnales ntaient pas
ncessairement dues la dpendance entre les observations. Par contre, nous
navons pas tenu compte de structure de dpendance quelconque entre les
donnes, dans le sens o nous avons compar les rsultats observs des rsul-
tats simuls o les donnes utilises taient indpendantes et avons conclus en
se basant l-dessus. Il serait donc intressant, dans de futures tudes, de trou-
ver une faon de juger de la qualit de la modlisation des vitesses de vent de
faon spare, en tenant aussi compte de la dpendance entre les observations,
par exemple dans les simulations.

En ce qui a trait lestimation de la production dnergie annuelle en kW/an


partir de la Weibull ou des frquences de la vitesse du vent mesure, nous
avons trouv des diffrences assez considrables entre les deux estimations
pour la plupart des sites. La compagnie Hatch pratique prsentement lestima-
tion de la production dnergie partir de lajustement dune distribution Wei-
bull et nous voulions voir quel point leur estimation pourrait tre influence
par lutilisation des frquences de la vitesse du vent mesure. Bien entendu,
nous ne savons jamais si la prochaine anne un site sera similaire aux an-
nes qui viennent de passer, en termes de vitesses de vent, et nous ne pouvons
pas tre certains que les vitesses de vent mesures sont plus reprsentatives
que celles obtenues par la modlisation de la distribution du vent partir de
la Weibull. Or, il ft intressant de dmontrer quil existe bel et bien une diff-
rence entre les deux mthodes et dautres tudes pourraient se pencher sur les
avantages dutiliser la distribution des vitesses de vent mesures, qui ne n-
cessite aucune modlisation ou encore sur la modlisation non paramtrique
de la distribution des vitesses de vent partir de diffrentes mthodes.
Chapitre 5

PRVISION DE LA VITESSE DU VENT PASSE


ET VALUATION DE LA VARIABILIT DE CETTE
PRVISION

5.1. U TILIT DES PRVISIONS DE LA VITESSE DU VENT SUR DES


ANNES PASSES

Les ingnieurs oliens tentent de prdire les donnes de vent long terme
afin davoir un indice de la moyenne de la vitesse du vent long terme plu-
tt que sur quelques annes seulement. Par exemple, sils ont install un mt
de mesure il y a trois ans et quils collectent des donnes depuis ce temps,
ils ont une mesure de la vitesse moyenne du vent pour les dernires annes
mais les banquiers veulent une valuation de la vitesse moyenne du vent sur
un plus long horizon, gnralement dix ans, pour mieux tenir compte des va-
riations annuelles. Ces ingnieurs cherchent donc des moyens permettant de
prdire le vent, plus long terme, partir dautres sources de donnes. La m-
thode MCP (Measure-Correlate-Predict), souvent utilise dans le domaine de
lolien, consiste en une faon de prdire le vent dans le pass, au-del de la
priode de donnes mesures sur des mts, partir de donnes disponibles sur
une plus longue priode, par exemple les donnes provenant dEnvironnement
Canada ou les donnes simules.

5.2. L A MTHODE MCP


5.2.1. Dfinition de la mthode

La mthode MCP est compose de trois tapes :


La collecte des donnes ("measure"),
68

la rgression linaire entre les donnes mesures sur un court terme et


les donnes simules ou dune source comme Environnement Canada sur
le long terme dont on garde la partie correspondante au court terme ("cor-
relate") et
la prvision dans le pass des vitesses de vent collectes non disponibles
partir de la rgression linaire dj faite ("predict").

Cest cette mthode qui permet aux ingnieurs de prdire la vitesse du vent
dans le pass. Par exemple, si deux annes de donnes collectes sont dispo-
nibles, mais que lon dsire obtenir une ide du vent moyen sur dix ans, on
prdit partir dune rgression linaire simple et des donnes simules (ou
dautres disponibles, comme celles dEnvironnement Canada) sur les huit annes
passes manquantes les vitesses de vent collectes puis on calcule la moyenne
de la vitesse du vent sur dix ans partir de deux annes relles et de huit an-
nes prdites. La prochaine section prsente les modles statistiques utiliss
pour la prvision de la vitesse du vent.

5.2.2. Les modles linaires utiliss pour faire les prvisions

Rappelons que nous utiliserons, tout au long de ce chapitre, les donnes col-
lectes moyennes aux heures de lanmomtre 1 quon note par yi , i = 0,1,...,N
ou encore Y. Nous considrerons trois modles de prvision et commence-
rons dabord par prsenter le cas gnral. Soit X la matrice compose dune
premire colonne pleine de 1 et dautres colonnes qui reprsenteront les pr-
dicteurs dans la rgression linaire qui nous permettra de prdire la vitesse du
vent dans le pass. Ici, X aura donc deux ou trois colonnes, dpendamment de
si lon utilise seulement les vitesses de vent mso-chelle (ce que Hatch veut in-
vestiguer), seulement les vitesses de vent provenant dune station de rfrence
(ce quils font prsentement), ou les deux prdicteurs ensemble dans une r-
gression linaire multiple (ce qui, selon nous, pourrait tre mieux).

On supposera dabord que les donnes mesures Y sont relies aux prdic-
teurs par le modle linaire suivant :

Y = X + ,

o Y est de taille (N + 1), est le vecteur de dimension p des paramtres


inconnus du modle, la matrice X, de taille (N + 1) par p, a t dfinie plus
tt et est le vecteur des erreurs de moyenne 0. Notez que la dimension de
chacune des colonnes de X est de (N + 1), puisque nous gardons la partie
69

commune des donnes mesures, mso-chelle et provenant dune station de


rfrence, et que ces deux derniers jeux de donnes couvrent compltement
la priode o des donnes mesures moyennes aux heures sont disponibles.
On a donc toujours les temps i = 0,...,N o les trois types de donnes sont
disponibles.

Il est possible destimer les coefficients partir de la formule des moindres


carrs, soit de la faon suivante :

= (X0 X)1 X0 Y. (5.2.1)

Cest avec ces coefficients que nous pourrons prdire la vitesse du vent en de-
hors du domaine de rgression, partir de la formule suivante de prvision
faite partir dune rgression linaire :
p
ynouveau = x0nouveau ,

pour xnouveau un vecteur compos des prdicteurs (la premire entit valant 1),
pour un temps (nouveau) qui nest pas contenu dans 0,1,...,N et pour lequel on
dsire une prvision.

Maintenant, voyons les trois cas considrs. Nous utiliserons dabord les vi-
tesses de vent mso-chelle seules dans une rgression linaire simple o la
variable dpendante est la vitesse de vent collecte lanmomtre 1. La ma-
trice X sera donc compose dune colonne pleine de 1 et dune colonne compo-
se de N + 1 vitesses de vent mso-chelle. On obtiendra, partir de la formule
(5.2.1), deux coefficients quon notera s,0 et s,1 . On dfinira comme suit la pr-
vision faite partir de ces coefficients et des vitesses de vent mso-chelle :

ys,i = s,0 + s,1 xs,i , i = Smin ,..., 1.

On pourra faire la mme chose partir des donnes provenant dune station
de rfrence, en modifiant la matrice X de sorte que la seconde colonne soit
compose de (N + 1) vitesses de vent fournies par une station de rfrence
situe prs du site. On estime encore, partir de la formule (5.2.1), les coeffi-
cients expliquant la relation linaire entre les donnes mesures et celles de la
station, puis on obtient deux coefficients quon notera maintenant r,0 et r,1 .
Il est donc possible de faire des prvisions de la vitesse du vent en dehors du
domaine, de la faon suivante :

yr,i = r,0 + r,1 xr,i , i = Rmin ,..., 1.


70

Finalement, on considre un troisime modle o la matrice X est compose de


trois colonnes : une colonne pleine de 1 et deux colonnes de prdicteurs, soient
les vitesses de vent simules mso-chelle et les vitesses rcoltes aux stations
de rfrence. La formule (5.2.1) nous fournira donc trois coefficients estims,
quon notera 0 , s et r , correspondant la colonne de 1, aux vitesses mso-
chelle et aux vitesses de la station de rfrence, respectivement. On pourra
donc prdire la vitesse du vent mesure en dehors du domaine de rgression,
laide de la formule suivante :

yi = 0 + s xs,i + r xr,i , i=max{Smin ,Rmin },...,-1.

5.3. VALIDATION CROISE SUR LES PREMIRES ANNES DE DON -


NES DISPONIBLES PARTIR DES DEUX DERNIRES ANNES

On comparera maintenant les trois modles vus dans la section prcdente


en terme derreurs de prvision dans le pass laide de la validation croise.
On verra alors lutilit des donnes simules mso-chelle pour les prvisions
long terme. Pour ce faire, dfinissons dabord les deux types dchantillons
qui seront utiliss dans la validation croise.

5.3.1. Les chantillons de validation et dapprentissage

Les ingnieurs oliens nont gnralement en leur possession que deux ou


trois annes de donnes collectes aux mts de mesure. Cest avec ces donnes
quils estiment le potentiel olien un site et lon voudrait donc connatre la
part de lerreur de prvision de la vitesse du vent qui entre en compte dans les-
timation du potentiel olien, lorsquun si petit nombre de donnes est dispo-
nible. Lon se mettra donc dans la position o seulement deux annes de don-
nes sont disponibles, afin de faire les prvisions de la vitesse du vent pass.
Lchantillon dapprentissage sera compos des deux dernires annes de don-
nes des trois types de sries de vent. Cest sur cet chantillon quon fera les
diffrentes rgressions linaires vues dans la section 5.2.2. Pour faciliter la com-
prhension, lon introduira maintenant la notation i = 0, 1,..., N N2ans , N
N2ans + 1,..., N pour lindice de temps horaire, o N2ans est le nombre dob-
servations disponibles durant les deux dernires annes o des donnes ont
t collectes. Ainsi, lchantillon dapprentissage sera compos des vitesses
de vent correspondant aux indices i = N N2ans + 1,..., N (ou encore i Eapp ),
et ce tant pour les donnes simules, des stations de rfrence et collectes.
La taille de Eapp sera note Napp (gale N2ans ). Notez que nous ne possdons
pas de donnes provenant de stations de rfrence pour plusieurs des sites.
71

Ces donnes sont disponibles pour seulement 15 sites sur 31. Notez aussi que
certains des sites o nous possdons des donnes provenant dune station de
rfrence navaient des donnes collectes que sur deux ou trois annes. Pour
ces sites, o lon possde tout de mme au moins deux ans de donnes, on
gardera une plus petite partie de donnes pour lchantillon dapprentissage
(environ le quart des donnes disponibles sur la priode complte et les autres
trois quarts pour faire la validation). Pour simplifier les notations, lon notera
par N2ans la taille de lchantillon dapprentissage, dans tous les cas mme ceux
o lon utilise moins de deux ans. Une validation croise sera aussi faite pour
les 16 autres sites o nous navons pas de donnes de rfrence, afin davoir
une ide de lerreur de prvision faite partir de la rgression o lon utilise
seulement les donnes mso-chelle.

Lchantillon de validation sera quant lui compos du restant de chacune


des sries yi , xs,i et xr,i (donc les indices de temps i = 0,...,N N2ans , ou encore
i Evalid ). Lon notera par Nvalid la taille de lchantillon de validation. Comme
son nom lindique, cet chantillon servira valider les diffrentes rgressions
linaires faites sur les sries dapprentissage, en calculant les prvisions de la
vitesse du vent passe et en les comparant ce qui est rellement collect sur
le site, lanmomtre 1.

5.3.2. Application de la validation croise

Comme lon dsire estimer lerreur de prvision des diffrentes rgressions


linaires de la section 5.2.2, on estime les coefficients s,0 , r,0 , 0 , s,1 , r,1 , r
et s des trois modles de rgression partir des sries de donnes de lchan-
tillon dapprentissage et des formules des moindres carrs montres dans cette
mme section. On obtient donc les formules de prvision suivantes :

ys,i = s,0 + s,1 xs,i ,


yr,i = r,0 + r,1 xr,i

et

yi = 0 + s xs,i + r xr,i ,

quon utilise afin de prdire aux indices i = 0,...,N N2ans (donc sur lchan-
tillon de validation) la vitesse du vent collecte. Or, pour ces indices, on pos-
sde aussi la vitesse de vent moyenne horaire de lanmomtre 1, yi . Il est donc
possible destimer lerreur quadratique moyenne de prvision pour chacune
des trois mthodes de prvision :
72

cv 1 X
EQM
\s = (yi ys,i )2 ,
Nvalid iEvalid
cv 1 X
EQM
\r = (yi yr,i )2 et
Nvalid iEvalid
cv 1 X
EQM
\ s,r = (yi yi )2 .
Nvalid iEvalid

On cherchera donc connatre la meilleure mthode de rgression, soit celle


offrant la plus petite erreur quadratique moyenne de prvision. On compa-
rera les modles laide de la racine carre de lerreur quadratique moyenne
estime.

5.3.3. Rsultats

Les rsultats des validations croises entreprises pour tous les 31 sites sont
prsents dans le tableau 5.1, la page suivante. En gras, on retrouve les er-
reurs quadratiques moyennes minimales entre celles trouves partir des trois
divers modles de rgression linaire.

5.3.4. Discussion

Dans un premier temps, on peut voir partir des rsultats que la mthode
prsentement utilise par Hatch, soit de prvoir la vitesse du vent partir des
donnes de stations de rfrence seulement, mne aux pires rsultats sauf pour
le site 19. part ce site, le modle avec les donnes mso-chelle seules pour
prvoir les vitesses mesures fait toujours mieux que le modle prsentement
utilis. Cependant, cela ne veut pas dire quon devrait simplement remplacer
les donnes de station de rfrence par les donnes mso-chelle. En effet, en
dfinissant lamlioration relative comme suit pour le modle deux prdic-
teurs par rapport celui o lon utilise seulement les donnes mso-chelle :
q q
cv cv
\ s EQM
EQM \ s,r
100 q ,
cv
EQM s
\

et en dfinissant de la mme faon lamlioration relative du modle deux


prdicteurs par rapport celui o on utilise seulement
q les donnes de la sta-
cv
tion de rfrence (on change seulement s par r dans EQM
\ s , dans la formule
ci-haut), on a pu trouver une amlioration relative de 8% (minimum de 0,1%,
maximum de 16,2%) lorsquon ajoutait les donnes de station de rfrence aux
73

donnes mso-chelle dj dans le modle alors que lutilisation des deux va-
riables augmente de 26,7% la prcision par rapport ce quils font prsente-
ment (minimum de 13,8%, maximum de 54,8%). Les deux types de donnes
sont donc utiles pour la prvision de la vitesse du vent mesure partir dune
rgression linaire (multiple dans ce cas).

TABLEAU 5.1. Racines carres des erreurs quadratiques


moyennes de prvision par validation croise pour chaque site
et chaque groupe de prdicteurs dans la rgression linaire

Site Nvalid Napp Donnes Donnes de Deux types de


1
simules station de rfrence donnes1
1 55 184 17 521 1,766 2,450 1,725
2 21 827 8 762 3,200 3,299 2,844
3 19 605 17 521 2,100 2,401 1,914
4 34 532 17 521 1,825 2,273 1,661
5 5 998 2 008 1,916 2,218 1,683
6 12 329 17 521 1,873 - -
7 25 949 17 521 1,406 1,962 1,334
8 5 998 2 613 2,243 - -
9 28 994 17 521 2,590 - -
10 23 008 17 521 2,429 - -
11 3 673 17 521 1,965 - -
12 5 999 2 671 1,365 - -
13 15 115 17 521 2,803 - -
14 26 718 17 521 3,039 - -
15 9 096 17 521 2,078 - -
16 11 532 17 521 1,761 - -
17 5 887 2 989 1,872 1,890 1,578
18 5 999 2 030 2,169 3,504 2,167
19 7 999 2 086 2,701 2,628 2,263
20 7 999 1 771 2,555 2,558 2,191
21 15 999 3 321 2,199 4,784 2,164
22 5 999 2 585 2,498 - -
23 14 999 4 698 2,156 - -
24 11 999 4 721 1,856 3,018 1,854
25 3 999 1 988 2,392 - -
26 1 599 788 2,673 - -
27 2 299 1 230 2,572 - -
28 5 999 2 719 2,411 - -
29 8 999 3 833 1,846 2,634 1,754
30 2 741 17 521 1,954 2,497 1,824
31 16 863 17 521 1,845 1,943 1,617
1
Les cases vides reprsentent les sites o nous ne possdions pas de donnes de stations de rfrence.
74

5.3.5. Estimation de la moyenne de la vitesse du vent long terme et erreur


relative

En plus destimer lerreur quadratique moyenne de prvision partir de la


validation croise, il nous est possible destimer la moyenne long terme de la
vitesse du vent partir des prvisions du vent dans lchantillon de validation
et des vitesses de vent mesures de lchantillon dapprentissage. Rappelons
la formule de la moyenne de la vitesse de vent long terme qui est utilise dans
la mthode M CP .

1 X X
y = yi + yi .
N +1 iEvalid

iEapp

Nous comparons donc cette estimation (dans laquelle yi est lestimation de yi


trouve partir des trois diffrents modles de prvision vus prcdemment)
la vritable vitesse moyenne du vent lanmomtre 1 pour chaque site, soit
N
1 X
y = yi .
N + 1 i=0

Le tableau 5.2 la page suivante prsente lerreur relative par rapport la


vritable moyenne de la vitesse lanmomtre 1.

5.3.6. Discussion

Dans les sections prcdentes, nous avons regard lestimation de lerreur


quadratique moyenne de prvision afin de dterminer laquelle des combinai-
sons de divers prdicteurs (donnes mso-chelle, de stations de rfrence ou
les deux ensemble) menait la plus petite EQMP. Cependant, Hatch utilise plu-
tt la moyenne long terme de la vitesse du vent comme indicateur de la valeur
dun site en terme dnergie olienne. Il tait donc intressant ici de comparer
les diffrentes estimations de la moyenne long terme afin de dterminer la-
quelle des mthodes semble offrir la meilleure estimation. Nous avons trouv,
pour le modle avec donnes mso-chelle seulement, une erreur relative abso-
lue moyenne de 1,604% (cart-type de 1,238) si on utilise seulement les 15 sites
comparables et de 2,089% (cart-type de 2,178) si on utilise tous les 31 sites.
Pour lestimation partir des observations provenant de stations de rfrence,
lerreur relative absolue moyenne tait de 1,203% (cart-type de 1,337). Quant
au modle deux prdicteurs, nous avons trouv une erreur relative absolue
moyenne de 1,090% (cart-type de 1,119). Notez donc que le modle avec les
donnes de station de rfrence comme seul prdicteur fait gnralement
75

TABLEAU 5.2. Erreurs relatives (%) entre la vitesse moyenne


long terme estime partir de chacun des trois modles de r-
gression et la vitesse moyenne des vitesses de vent mesures
lanmomtre 1

Site Nvalid Napp Donnes Donnes de Deux types de


simules station de rfrence1 donnes1
1 55 184 17 521 -0,444 1,223 0,015
2 21 827 8 762 -0,364 1,645 1,645
3 19 605 17 521 -0,495 0,005 -0,421
4 34 532 17 521 -0,715 -0,875 -0,321
5 5 998 2 008 2,516 4,219 1,981
6 12 329 17 521 -0,243 - -
7 25 949 17 521 1,160 -0,878 0,524
8 5 998 2 613 1,557 - -
9 28 994 17 521 1,748 - -
10 23 008 17 521 2,808 - -
11 3 673 17 521 0,641 - -
12 5 999 2 671 -0,069 - -
13 15 115 17 521 -3,552 - -
14 26 718 17 521 -0,146 - -
15 9 096 17 521 -0,007 - -
16 11 532 17 521 -0,039 - -
17 5 887 2 989 -1,326 3,703 0,255
18 5 999 2 030 -1,120 -0,042 -0,354
19 7 999 2 086 3,362 -0,724 0,830
20 7 999 1 771 3,740 -0,579 -1,062
21 15 999 3 321 0,796 -0,208 -1,231
22 5 999 2 585 -8,010 - -
23 14 999 4 698 2,945 - -
24 11 999 4 721 2,147 0,851 2,037
25 3 999 1 988 -4,824 - -
26 1 599 788 -3,935 - -
27 2 299 1 230 -1,363 - -
28 5 999 2 719 8,812 - -
29 8 999 3 833 -3,730 2,791 -4,351
30 2 741 17 521 -0,197 0,153 -0,080
31 16 863 17 521 1,943 -0,145 1,249
1
Les cases vides reprsentent les sites o nous ne possdions pas de donnes de stations de rfrence.

mieux que celui avec les donnes mso-chelle ici, et que cest le seul de nos
tests qui prsente de tels rsultats. Par contre, les donnes mso-chelle ne sont
pas bannir puisquelles apportent encore un peu dinformation dans le mo-
dle deux prdicteurs lors de la prvision de la vitesse du vent passe. En
76

effet, le modle deux prdicteurs est le meilleur en terme derreur relative


absolue moyenne sur tous les sites.

5.4. C ALCUL DE LA VARIABILIT DES PRVISIONS PARTIR DU


BOOTSTRAP

Les estimateurs de la validation croise de la section prcdence estiment


(5.4.1), lerreur quadratique moyenne de prvision :
!
1 X
2
EQM P =E (yi yi )
Nvalid iE
valid

1 
0

= E (Yvalid Yvalid ) (Yvalid Yvalid ) . (5.4.1)
Nvalid
Ils ne peuvent tre calculs que si nous avons les valeurs de yi dans lensemble
de validation, ce qui nest gnralement pas le cas. Afin de voir comment nous
pourrions estimer lEQMP, faisons lhypothse, comme nous lavons fait jus-
qu maintenant, que les observations sont indpendantes, de mme variance.
Afin dallger la notation, dnotons par X et Xv les matrices de variables expli-
catives pour les observations dapprentissage et de validation, respectivement.
Voyons comment il est possible de dvelopper la formule de lerreur quadra-
tique moyenne de prvision si lon postule

Yapp =X +
Yvalid =Xv + v

o E() = 0Napp , E(v ) = 0Nvalid , V ar() = 2 INapp Napp , V ar(v ) = 2 INvalid Nvalid
et et v sont indpendants.

Lors de la validation croise, nous navons que Yapp puisque Yvalid nest g-
nralement pas observ. On estime donc par les moindres carrs sur le bloc
dapprentissage, soit

= (X0 X)1 X0 Yapp . (5.4.2)

On prdit les valeurs de Yvalid laide de

Yvalid = Xv = Xv (X0 X)1 X0 Yapp .

Pour calculer lEQMP dans (5.4.1), notons que :

Yvalid Yvalid =Xv (X0 X)1 X0 (X + ) (Xv + v )


=Xv + Xv (X0 X)1 X0 Xv v
77

=Xv (X0 X)1 X0 v .

De cette faon, on trouve que

(Yvalid Yvalid )0 (Yvalid Yvalid ) =0 X(X0 X)1 X0v Xv (X0 X)1 X0


20 X(X0 X)1 X0v v + 0v v .

Maintenant, si E() = et V ar() = V , alors E(0 A) = tr(AV ) + 0 A


(Searle, 1971), de telle sorte quavec les hypothses poses prcdemment, on
a
1 
0

E (Yvalid Yvalid ) (Yvalid Yvalid ) (5.4.3)
Nvalid

1
2 tr(X(X0 X)1 X0v Xv (X0 X)1 X0 ) + 0 + 2 tr(INvalid )

=
Nvalid

tr((X0 X)1 X0v Xv )


 
2
= 1+ . (5.4.4)
Nvalid
Bien entendu, cela demeure vrai en autant que le modle tienne tant pour le
vecteur Yapp que pour le vecteur Yvalid .

Il est donc possible destimer lEQMP avec cette dernire formule en rempla-
ant 2 par son estimateur bas sur la somme des carrs des rsidus de la r-
gression calcule sur les donnes appartenant Eapp .

Maintenant, un des problmes qui se pose dans la dmarche prcdente est


lhypothse dindpendance entre les erreurs. Nous avons vu dans le chapitre
prcdent (section 4.4.2) que lhypothse de lindpendance des vitesses de
vent mesures dans le temps nest pas compatible avec les donnes et il existe
donc une certaine structure de corrlation pour les erreurs du modle de r-
gression linaire entre les donnes mesures et divers prdicteurs. Postulons
donc maintenant ceci :
! ! !
Yapp X
= +
Yvalid Xv v
o on fait maintenant les hypothses
! ! ! !
0Napp V11 V12
E = et V ar = . (5.4.5)
v 0Nvalid v V21 V22
Voyons quoi ressemble la formule de lerreur quadratique moyenne de pr-
vision dveloppe selon ces hypothses.

On utilise les mmes estimateurs des coefficients de la rgression linaire, soient


78

ceux prsents en (5.4.2). Les tapes menant au dveloppement de lerreur qua-


dratique moyenne de prvision sont les mmes, sauf au moment o la matrice
de variance des erreurs change. Reprenons donc partir de (5.4.3) :

1  
E (Yvalid Yvalid )0 (Yvalid Yvalid )
Nvalid

1
E 0 X(X0 X)1 X0v Xv (X0 X)1 X0

=
Nvalid
20 X(X0 X)1 X0v v + 0v v .


Grce Searle (1971), on sait que :

E 0 X(X0 X)1 X0v Xv (X0 X)1 X0




= tr X(X0 X)1 X0v Xv (X0 X)1 X0 V11




et E (0v v ) = tr (V22 ) .

De plus, on peut calculer la valeur de 2E (0 X(X0 X)1 X0v v ) en crant de


nouvelles matrices, soient
! !
0Napp Napp A
nouveau = et B =
v 0Nvalid Napp 0Nvalid Nvalid
o

A = X(X0 X)1 X0v .

Alors rechercher 2E (0 X(X0 X)1 X0v v ) revient calculer ceci :


!!
V 11 V 12
2E (0nouveau B nouveau ) = 2tr B
V21 V22
! !!
0Napp Napp A V11 V12
= 2tr
0Nvalid Napp 0Nvalid Nvalid V21 V22
= 2tr (AV21 ) = 2tr X(X0 X)1 X0v V21 .


Finalement, on peut regrouper tout ensemble pour montrer que lerreur qua-
dratique moyenne de prvision sous les hypothses poses prcdemment de-
vient :
1  
tr X(X0 X)1 X0v Xv (X0 X)1 X0 V11

Nvalid

2tr X(X0 X)1 X0v V21 + tr (V22 ) .


 
(5.4.6)
79

On remarque assez rapidement que, comparativement lerreur quadra-


tique moyenne de prvision dveloppe sous lhypothse dindpendance des
erreurs, on obtient ici plusieurs termes qui ne sannulent plus entre eux. On
aura entre autres les coefficients lintrieur des partitions de la matrice de
variance-covariance estimer (ceux des matrices V11 , V12 , V21 et V22 ), contrai-
rement lautre dveloppement o nous avions simplement 2 estimer. Ainsi,
lon pourrait maintenant utiliser des modles de sries chronologiques afin
destimer ces coefficients en ajustant un modle nos donnes. Or, lon ne
connat pas bien la tendance de la corrlation entre les donnes et lon ne sait
pas si des modles classiques de sries chronologiques sajustent bien aux don-
nes. Une option soffrant nous et qui rgle alors le problme est lestima-
tion de lerreur quadratique moyenne de prvision partir du bootstrap par
bloc. En utilisant des blocs de donnes conscutives, nous pourrons capturer
en bonne partie la structure de dpendance entre les rsidus des diverses r-
gressions sans avoir estimer les paramtres dun modle postul pour la ma-
trice de variance-covariance. Commenons dabord par revoir en quoi consiste
le bootstrap.

5.4.1. Le bootstrap utilis sur des donnes indpendantes et identique-


ment distribues

Le bootstrap est une mthode dinfrence statistique introduite par Efron


en 1979, base sur le rchantillonnage des donnes observes (boostrap non
paramtrique) ou la simulation de donnes provenant dune distribution para-
mtrise particulire (bootstrap paramtrique). Cette mthode a t introduite
par Efron en 1979 . Elle a pour objectif lestimation de certaines caractristiques
de la distribution dune statistique, par exemple, sa dispersion.

Considrons le cas o lon possde un chantillon compos de n donnes


X1 ,...,Xn , quon considre comme i.i.d. de fonction de distribution F . Suppo-
sons que lon dsire estimer la dispersion dun certain paramtre F , lequel
est estim par la statistique F = Tn (X1 ,...,Xn ), qui dpend de lchantillon
observ. Afin destimer la dispersion, on doit donc estimer la distribution de
notre estimateur F . Si lon doit estimer la distribution de notre statistique qui
dpend de lchantillon, on a besoin dobserver cette statistique plusieurs fois
et cest ce moment que le bootstrap entre en jeu. On aura le choix entre ti-
rer de faon alatoire et avec remise B chantillons de n donnes parmi notre
chantillon initial X1 ,...,Xn , ou, si la distribution F est paramtrise, F (), des-
timer les paramtres de cette distribution, n , et de tirer un chantillon de la
80

distribution Fn = F (n ) avec les valeurs estimes des paramtres afin de si-


muler pour chaque bootstrap un chantillon de n observations, dans les deux
cas, cela nous permettant de calculer sur chacun de ces chantillons (crs de

faon paramtrique ou non) la statistique Tb,n (Xb,1 ,...,Xb,n ), o b = 1,...,B. La
distribution de ces B statistiques bootstrap reprsentera donc une estimation
de la distribution de la statistique Tn , de sorte quen calculant sur cette distri-
bution estime la variance chantillonnale, on obtiendra une estimation de la
variance de lestimateur Tn . On peut faire de mme pour dautres caractris-
tiques de la distribution quon voudrait estimer, par exemple lerreur quadra-
tique moyenne de prvision.
5.4.2. Le bootstrap pour valuer lerreur quadratique moyenne de prvi-
sion partir dune rgression linaire sur des donnes i.i.d.

Dans le cas de la rgression linaire o lhypothse dindpendance entre


les vitesses de vent mesures tiendrait, il est possible de dcrire un algorithme
o le bootstrap nous permettrait destimer lerreur quadratique moyenne de
prvision, toujours partir de la rgression linaire multiple o X = Xapp est
la matrice compose des prdicteurs et Yapp le vecteur compos de la variable
dpendante dans la rgression. On dfinit aussi la matrice
!
X
XN =
Xvalid
et on rappelle que Y reprsente le vecteur des vitesses de vent mesures sur
toute la priode disponible, soit pour les temps 0,1,...,N .

La quantit quon veut estimer ici est lerreur quadratique moyenne de prvi-
sion, cest--dire
!
1 X
EQM P = E (yi yi )2 . (5.4.7)
Nvalid iE
valid

On doit donc obtenir plusieurs jeux bootstrap de prvision du vent dans le


pass (le pass correspondant ici aux temps i Evalid ) afin de calculer plusieurs
fois le terme dans lesprance et destimer son esprance par sa moyenne. Lal-
gorithme va comme suit :

Algorithme bootstrap pour lestimation de lEQMP dans le cas dobservations i.i.d.


(1) Rgresser Yapp sur X afin dobtenir les coefficients initiaux partir de
la formule (5.4.2).
(2) Calculer les rsidus de la rgression faite en (1).
81

(3) Tirer de facon alatoire avec remise (N + 1) rsidus parmi ceux calculs
ltape prcdente, de sorte les mettre les uns aprs les autres et
ainsi crer une srie derreurs bootstrap de longueur (N + 1).
(4) Crer les observations bootstrap comme suit :

Y = XN + ,

o lon peut dcomposer Y en deux vecteurs Yvalid



et Yapp .

(5) Rgresser Yapp sur X et obtenir les coefficients bootstrap .
(6) Calculer les prvisions bootstrap dans le pass comme suit :

Yvalid = Xvalid .

(7) Calculer la moyenne des carrs des rsidus de la rgression bootstrap


comme suit :
0 
\P = 1
 

EQM Yvalid Yvalid Yvalid Yvalid .
Nvalid
(8) Reproduire les tapes (3) (7) un nombre B de fois pour obtenir B

moyennes des carrs des rsidus de rgression EQM
\P .
boot
(9) Calculer EQM
\P la moyenne des B estimations qui devient lestima-
teur bootstrap de lerreur quadratique moyenne de prvision.

5.4.2.1. Le bootstrap par bloc

Nous venons de voir comment il est possible destimer lerreur quadratique


moyenne des prvisions faites partir dune rgression linaire, dans le cas o
la variable dpendante dans la rgression est considre comme i.i.d. Or, tel
que mentionn plus tt, il existe une structure de corrlation assez complexe
modliser entre les vitesses de vent mesures. Il est possible de tenir compte
de la dpendance entre les erreurs en modifiant lgrement lalgorithme boots-
trap prsent dans la section prcdente. En effet, regrouper les erreurs boots-
trap provenant de la rgression dans des blocs permettrait de tenir compte de
cette dpendance. Voyons maintenant notre nouvelle faon de procder :

Algorithme bootstrap pour lestimation de lEQMP dans le cas dobservations dpen-


dantes entre elles
(1) Rgresser Yapp sur X afin dobtenir les coefficients initiaux partir de
la formule (5.4.2).
(2) Calculer les rsidus de la rgression faite en (1).
82

(3) Crer Napp l + 1 blocs de rsidus de longueur l partir des rsidus


calculs ltape prcdente. Chaque bloc h est compos des l rsidus
conscutifs (h ,...,h+l1 ) et les blocs se chevauchent de sorte que chaque
bloc est dcall dune unit de temps par rapport au bloc prcdent.
(4) Tirer avec remise parmi ces blocs de longueur l un nombre s de blocs de
rsidus quon colle ensemble, les uns aprs les autres, afin de crer une
srie de rsidus de longueur N + 1 (donc s = d( N +1
l
)e). Si la longueur de
la srie compose des blocs mis les uns aprs les autres dpasse N + 1,
on coupe N + 1 rsidus. La srie compose des blocs colls les uns
aprs les autres est utilise comme srie derreurs bootstrap .
(5) Crer les observations bootstrap comme suit :

Y = XN + , (5.4.8)

o lon peut dcomposer Y en deux vecteurs Yvalid



et Yapp .

(6) Rgresser Yapp sur X et obtenir les coefficients bootstrap .
(7) Calculer les prvisions bootstrap dans le pass comme suit :

Yvalid = Xvalid . (5.4.9)

(8) Calculer la moyenne des carrs des rsidus de la rgression bootstrap


comme suit :
,l 1  0  

EQM P =
\ Yvalid Yvalid Yvalid Yvalid .
Nvalid
(9) Reproduire les tapes (3) (8) un nombre B de fois pour obtenir B
,l
moyennes des carrs des rsidus de rgression EQM
\P .
boot,l ,l
(10) Calculer la moyenne EQM \P des B estimations EQM\P qui de-
vient lestimateur bootstrap de lerreur quadratique moyenne de prvi-
sion.
boot,l
On notera lestimateur de lEQMP (5.4.7) par EQM
\P dans le cas o la ma-
trice XN est compose dune colonne de 1, dune colonne de vitesses de vent
mso-chelle et dune troisime colonne de vitesses de vent provenant de sta-
boot,l
tion de rfrence. On notera par EQM
\P s lestimateur de lEQMP dans le cas
o la matrice XN est compose dune colonne de 1 et dune colonne de vitesses
boot,l
de vent mso-chelle seulement. Finalement, on notera par EQM
\P r lesti-
mateur de lEQMP dans le cas o la matrice XN est compose dune colonne de
1 et dune colonne de vitesses de vent provenant de station de rfrence seule-
ment. On testera diffrentes tailles de blocs l afin de vrifier leffet du change-
ment de la taille sur les rsultats. On pourra comparer les estimations derreurs
83

quadratiques moyennes obtenues celles obtenues par validation croise dans


la section prcdente, afin de voir quelle taille mnerait aux rsultats les plus
similaires. On rapportera donc dans le tableau 5.3 la diffrence absolue rela-
boot,l boot,l boot,l
tive entre la racine de EQM
\P (ou EQM
\P s , ou EQM \P r ) et la racine
carre de lEQM trouve partir de la validation croise, pour les trois mo-
dles respectifs et pour chaque taille de bloc considre. La diffrence absolue
relative (DAR) sera calcule de la faon suivante pour les trois modles :
q q
boot,l cv
l
EQM
\ P EQM
\ s,r
DARs,r =100 q cv
,
EQM s,r
\
q q
boot,l cv
EQM
\P s EQM
\s
DARsl =100 q ,
cv
EQM s
\
q q
boot,l cv
EQM
\ P r EQM
\r
DARrl =100 q .
cv
EQM r
\

Voyons maintenant les tailles de blocs que nous avons considres ici.

5.4.2.2. Tailles des blocs derreurs bootstrap

La dmarche dcrite dans la section prcdente sera reproduite pour trois


diffrentes tailles l de bloc de rsidus. On sattend mieux capturer la structure
de dpendance lorsquon utilise des blocs plus longs. Notez que lutilisation de
blocs de longueur l implique quon fait lhypothse que les lments de la ma-
trice de variance-covariance dans (5.4.5) qui sont une distance suprieure
l1 de la diagonale sont gaux 0. Cependant, plus les blocs sont longs, moins
on possde de blocs pour estimer la distribution conjointe de dimension l. Il
sagit donc dun compromis que de choisir une longueur de bloc. Dans notre
cas, on testera dabord la mthode avec des blocs de longueur 1 (un). Notez
que lutilisation de blocs de longueur 1 dans le bootstrap par bloc devrait me-
ner, pour un nombre de bootstraps assez grand, des rsultats trs similaires
ceux obtenus lors du calcul de lerreur quadratique moyenne partir des for-
mules des moindres carrs, pour lesquelles lhypothse dindpendance entre
les donnes doit tre faite ; voir (5.4.4). En effet, une structure de dpendance
contenue dans des blocs de longueur 1 est quivalente considrer lindpen-
dance entre les donnes. Ensuite, on testera le bootstrap pour des blocs de taille
1
l = Napp
3
(Davison & Hinkley, 1997), donc l 26 pour les sites o Napp est qui-
valent au nombre dheures contenues dans deux ans. Finalement, le calcul sera
84

fait pour des blocs de taille 200 afin de voir limpact sur les rsultats lorsque
des blocs plus longs sont utiliss. Il est intressant de remarquer que des blocs
de taille 26 24 couvriront environ une structure de dpendance entre les
donnes qui stend sur 24 heures, donc une journe, alors quune structure de
dpendance stendant sur 200 donnes correspond environ considrer quil
y a de la dpendance jusqu un dlai dune semaine entre les vitesses de vent
mesures. Aussi, nous avons vu dans la section 4.4.2 que la corrlation entre
les observations tait bien prsente sur un dlai de plus de quatre jours, et les
blocs de taille 200 couvriront au moins ces quatres jours o la corrlation est
plus forte.

5.4.2.3. Rsultats

TABLEAU 5.3. Diffrence absolue relative (DAR) entre la racine


carre de lerreur quadratique moyenne de prvision sur 1 000
bootstraps et la racine carre de lerreur quadratique trouve par
validation croise, pour chaque taille de bloc et chaque groupe
de prdicteurs dans la rgression (%)

Site Nvalid Napp Taille DARsl DARrl 1 l


DARs,r 1

blocs (l)
1 55 184 17 521 1 -2,95 -4,29 -2,33
26 -2,92 -4,26 -2,30
200 -3,19 -4,58 -2,60
2 21 827 8 762 1 -5,39 -1,41 -3,76
21 -5,48 -1,26 -3,66
200 -5,30 -1,68 -3,74
3 1 9605 17 521 1 3,72 0,83 1,43
26 3,73 0,79 1,46
200 3,63 0,68 1,33
4 34 532 17 521 1 -1,33 -3,24 -0,56
26 -1,30 -3,20 -0,52
200 -1,34 -3,39 -0,65
5 5 998 2 008 1 -5,66 -12,42 -11,37
13 -5,54 -12,44 -11,27
200 -7,64 -14,11 -13,26
6 12 329 17 521 1 5,36 - -
26 5,43 - -
200 5,37 - -
7 25 949 17 521 1 1,08 -2,80 -0,86
26 1,09 -2,84 -0,90
200 0,76 -3,09 -1,17
1
Les cases vides reprsentent les sites o nous ne possdions pas de donnes de stations de rfrence.
85

(Suite)

Site Nvalid Napp Taille DARsl DARrl 1 l


DARs,r 1

blocs (l)
8 5 998 2 613 1 -8,67 - -
14 -8,91 - -
200 -10,54 - -
9 28 994 17 521 1 -4,32 - -
26 -4,28 - -
200 -4,55 - -
10 23 008 17 521 1 -2,80 - -
26 -2,82 - -
200 -2,99 - -
11 3 673 17 521 1 -9,64 - -
26 -9,57 - -
200 -10,00 - -
12 5 999 2 671 1 6,12 - -
14 6,23 - -
200 4,80 - -
13 15 115 17 521 1 -2,82 - -
26 -2,86 - -
200 -2,90 - -
14 26 718 17 521 1 -4,37 - -
26 -4,34 - -
200 -4,56 - -
15 9 096 17 521 1 1,29 - -
26 1,25 - -
200 1,01 - -
16 11 532 17 521 1 -2,65 - -
26 -2,63 - -
200 -2,75 - -
17 5 887 2 989 1 -1,92 24,96 10,46
15 -1,80 25,07 10,57
200 -4,23 23,58 8,79
18 5 999 2 030 1 -3,05 -5,11 -3,44
13 -2,82 -4,93 -3,25
200 -4,87 -6,71 -5,45
19 7 999 2 086 1 -7,40 -12,71 -7,73
13 -7,99 -12,89 -7,87
200 -9,73 -14,72 -9,53
20 7 999 1 771 1 -3,41 -11,48 -7,31
13 -3,67 -11,67 -7,20
200 -7,10 -15,66 -10,28
21 15 999 3 321 1 -11,76 -30,82 -10,46
15 -11,58 -30,72 -10,20
200 -13,33 -31,02 -11,94
1
Les cases vides reprsentent les sites o nous ne possdions pas de donnes de stations de rfrence.
86

(Suite)

Site Nvalid Napp Taille DARsl DARrl 1 l


DARs,r 1

blocs (l)
22 5 999 2 585 1 26,37 - -
14 26,25 - -
200 24,05 - -
23 14 999 4 698 1 12,02 - -
17 12,11 - -
200 10,97 - -
24 11 999 4 721 1 -10,22 -7,41 -10,15
17 -10,13 -7,45 -10,12
200 -11,35 -8,97 -11,11
25 3 999 1 988 1 -13,33 - -
13 -13,32 - -
200 -17,28 - -
26 1 599 788 1 -13,41 - -
10 -13,19 - -
200 -16,83 - -
27 2 299 1 230 1 -4,34 - -
11 -3,92 - -
200 -6,58 - -
28 5 999 2 719 1 9,23 - -
14 9,54 - -
200 7,99 - -
29 8 999 3 833 1 9,91 9,98 15,24
16 10,02 10,11 15,31
200 9,41 9,32 14,90
30 2 741 17 521 1 2,41 8,03 2,00
26 2,35 8,12 1,71
200 2,03 7,72 1,85
31 16 863 17 521 1 -4,30 9,64 0,33
26 -4,38 9,58 0,31
200 -4,61 9,59 0,11
1
Les cases vides reprsentent les sites o nous ne possdions pas de donnes de stations de rfrence.

5.4.2.4. Discussion

On remarque, pour une majorit des sites, que la longueur des blocs ne
change pas beaucoup la diffrence absolue relative des racines carres des er-
reurs quadratiques moyennes par rapport celles obtenues par validation croi-
se. On voit aussi que le modle menant aux EQMP calcules partir du boots-
trap se rapprochant le plus de lEQM calcule avec la validation croise est
plutt difficile dterminer, puisque pour 7 des 15 sites o lon peut comparer
87

les trois modles, il sagit du modle deux prdicteurs (moyenne des DARs,r
1/3
absolues de 5,78%, l = Napp ), mais que ce modle est suivi de trs prs par
celui o lon utilise seulement les donnes mso-chelle (5 sites sur 15 o les
rsultats sont les plus similaires la validation croise, avec une moyenne des
1/3
DARs absolues de 6,50%, l = Napp pour les 31 sites ou une moyenne de 4,99%
sur les 15 sites comparables seulement). Notez que la moyenne des DARr ab-
1/3
solues tait plutt de 9,69% pour l = Napp .

Suite cette analyse, nous aurions aim trouver une diffrence dans les rsul-
tats lorsque nous faisions varier la taille des blocs dans le bootstrap. On croit
que la diffrence a t camoufle par un des termes dans lerreur quadratique
moyenne de prvision. Effectivement, en prenant en exemple la formule de
lEQMP sous lhypothse dindpendance entre les donnes, on pouvait voir
2
partir
 de (5.4.4) que
 le terme de variance multipli par 1 domine le terme
0 1 0 2
2 tr((X X)
Napp
Xv Xv )
, ce dernier tant dordre Napp , avec un Napp trs grand (rap-
pelons que les erreurs quadratiques moyennes de prvision sont calcules ici
partir des Napp observations de lchantillon dapprentissage). On ne peut pas
aussi clairement diffrencier les termes dans la formule (5.4.6), formule o lon
tenait compte de la covariance entre les donnes, mais on pense que le mme
phnomne se produit et que cela pourrait peut-tre expliquer pourquoi on ne
dtecte aucune diffrence au niveau de la taille des blocs dans le bootstrap. Ef-
fectivement, la variance dune prvision faite partir dune rgression linaire
peut tre dcompose en la variance due la prochaine observation autour de
la droite de rgression et la variance due lestimation de la droite de rgres-
sion (en considrant une rgression linaire simple). Comme nous possdons
ici un trs grand nombre dobservations pour faire la rgression linaire (peu
importe le modle considr), la variance due lestimation de la droite de
rgression risque dtre plutt faible par rapport celle due la prochaine
observation autour de la droite (plus dobservations mnent une estimation
moins variable de la droite de rgression). Or, on sattend ce que la taille
des blocs influence davantage la variance de lestimation de la droite que celle
de la prochaine observation. Par exemple, nous savons que des observations
dpendantes entre elles mneront une plus grande variance de la droite de
rgression que des donnes indpendantes (la dpendance entre les donnes
nous donnant accs moins dinformation diffrente sur ces dernires).

Nous sommes donc maintenant intresss voir leffet de la taille de bloc sur
la variance de la droite de rgression, ou encore de faon semblable sur la va-
riance de la prvision moyenne (cette prvision se trouvant sur la droite de
88

rgression et qui demeure une quantit dintrt pour les ingnieurs de chez
Hatch, pour qui une estimation de la variance pourrait tre utile).

5.4.2.5. valuation de la variance de la moyenne long terme estime

Comme la mthode M CP est utilise afin destimer la moyenne long terme


de la vitesse du vent, on voudrait maintenant vrifier si la taille des blocs dans
le bootstrap aura un effet important sur la variabilit (estime laide du boots-
trap) de la moyenne long terme estime. On se concentre donc sur la variance
due la droite (ou au plan) de rgression et on risque maintenant de dtecter
une diffrence selon la taille des blocs utiliss dans notre bootstrap.

Redfinissons dabord la moyenne long-terme calcule avec les vitesses de


vent mesures moyennes aux heures de lanmomtre 1 :
N
1 X
y = yi .
N + 1 i=0

Si lon ne possdait pas les premires Nvalid vitesses de vent collectes, on pour-
rait utiliser lun des modles linaires afin dobtenir des prvisions de la vitesse
du vent pour i Evalid , quon note yi et, du mme coup, lestimation de la vi-
tesse moyenne long terme par la mthode MCP deviendrait :

1 X X

y = yi + yi . (5.4.10)
N +1 iEvalid

iEapp

Maintenant, si lon dsire valuer la variance de la moyenne long terme esti-


me y, on peut encore une fois utiliser le bootstrap. Pour chaque bootstrap b, il
est possible destimer cette moyenne long terme en utilisant le mme modle
de rgression linaire utilis dans (5.4.10) et en prdisant la vitesse du vent
pour i Evalid , puis en rutilisant les prvisions bootstrap trouves partir du
modle (Y b ), de la faon suivante :

1 X X
yb =
yb,i +
yb,i .
N + 1 iE iEapp

valid


pour b=1,...,1 000, o yb,i est dfini en (5.4.9) et yb,i est dfini en (5.4.8).

Aprs avoir calcul pour les 1 000 bootstraps cette moyenne long terme esti-
me, on peut calculer la variance chantillonnale comme suit :
1000
1 X 2
V ar (yb ) =

yb y ,
999 b=1
89

o
1000
1 X
y = y
1000 b=1 b

On fait ces calculs pour les prvisions estimes partir des trois diffrents mo-
dles. On obtient ainsi trois mesures de variance de la moyenne long terme
estime et ce pour une taille de bloc l donne.

Afin de dterminer si la taille de bloc a un effet sur la variance de la moyenne


long terme estime, on prsentera dans le tableau suivant le rapport des va-
riances trouves partir du bootstrap, pour deux diffrentes tailles de blocs.
1
Encore une fois, les tailles de blocs qui ont t considres taient 1, Napp
3
et 200.
90

TABLEAU 5.4. Rapports de la variance de lestimateur de la


moyenne bootstrap par bloc de longueur l par rapport la va-
riance pour un bloc de longueur 1

Site Nvalid Napp Rapport des Donnes Donnes de Deux types de


1 2
tailles de bloc simules station de rfrence donnes2
1 55 184 17 521 26/1 7,80 11,11 7,10
200/1 13,97 19,04 13,62
2 21 827 8 762 26/1 5,60 5,56 6,47
200/1 9,84 20,09 10,47
3 19 605 17 521 26/1 8,66 9,53 6,33
200/1 18,17 22,25 16,00
4 34 532 17 521 26/1 8,27 10,07 7,43
200/1 18,29 14,67 13,70
5 5 998 2 008 26/1 4,44 4,47 4,16
200/1 2,31 5,82 2,97
6 12 329 17 521 26/1 9,53 - -
200/1 26,13 - -
7 25 949 17 521 26/1 6,70 9,55 6,09
200/1 10,81 14,79 9,21
8 5 998 2 613 26/1 5,11 - -
200/1 7,60 - -
9 28 994 17 521 26/1 6,02 - -
200/1 10,27 - -
10 23 008 17 521 26/1 7,20 - -
200/1 19,10 - -
11 3 673 17 521 26/1 6,49 - -
200/1 12,21 - -
12 5 999 2 671 26/1 5,81 - -
200/1 10,30 - -
13 15 115 17 521 26/1 7,51 - -
200/1 16,43 - -
14 26 718 17 521 26/1 7,76 - -
200/1 14,49 - -
15 9 096 17 521 26/1 7,71 - -
200/1 16,52 - -
16 11 532 17 521 26/1 6,44 - -
200/1 11,16 - -
17 5 887 2 989 26/1 5,96 6,99 5,57
200/1 9,07 14,67 9,04
18 5 999 2 030 26/1 6,48 8,03 5,93
200/1 15,16 13,91 14,24
1 1
Ici, 26 rfre la taille N 3 et peut donc valoir moins de 26 dans quelques cas. Voir le tableau 5.3 pour
les tailles utilises.
2
Les cases vides reprsentent les sites o nous ne possdions pas de donnes de stations de rfrence.
91

(Suite)

Site Nvalid Napp Rapport des Donnes Donnes de Deux types de


1 2
tailles de bloc simules station de rfrence donnes2
19 7 999 2 086 26/1 4,81 4,23 3,58
200/1 5,76 5,78 4,85
20 7 999 1 771 26/1 5,58 5,86 4,14
200/1 5,54 6,41 6,06
21 15 999 3 321 26/1 6,01 4,14 5,03
200/1 10,75 6,59 7,40
22 5 999 2 585 26/1 7,29 - -
200/1 27,23 - -
23 14 999 4 698 26/1 3,19 - -
200/1 5,79 - -
24 11 999 4 271 26/1 5,49 10,52 6,24
200/1 9,47 22,91 9,50
25 3 999 1 988 26/1 4,00 - -
200/1 9,87 - -
26 1 599 788 26/1 4,39 - -
200/1 9,81 - -
27 2 299 1 230 26/1 5,50 - -
200/1 8,80 - -
28 5 999 2 719 26/1 7,71 - -
200/1 15,62 - -
29 8 999 3 833 26/1 6,40 9,49 6,37
200/1 14,61 26,30 15,84
30 2 741 17 521 26/1 7,71 10,32 7,99
200/1 12,89 23,70 12,14
31 16 863 17 521 26/1 6,17 10,26 6,19
200/1 11,09 16,23 8,20
1 1
Ici, 26 rfre la taille N 3 et peut donc valoir moins de 26 dans quelques cas. Voir le tableau 5.3 pour
les tailles utilises.
2
Les cases vides reprsentent les sites o nous ne possdions pas de donnes de stations de rfrence.

5.4.2.6. Discussion

On peut maintenant voir que la taille des blocs de rsidus a un effet sur la
variabilit de la moyenne long terme estime, contrairement lerreur quadra-
tique moyenne de prvision calcule partir du bootstrap. De faon gnrale,
1
lutilisation de blocs derreurs bootstrap de taille Napp
3
mne des variances
estimes entre 3,19 et 9,53 fois suprieures aux variances estimes partir de
92

blocs de taille 1. En ce qui a trait aux blocs de taille 200, ils mnent des va-
riances estimes entre 5,54 et 27,23 fois suprieures aux variances correspon-
dant aux blocs de taille 1. On remarque que le ratio 200/1 est peu prs tou-
jours deux fois plus grand que le ratio 26/1. Les rsultats indiquent donc quil
est important de tenir compte du dlai de corrlation entre les observations
dans le temps, si lon dsire utiliser le bootstrap pour obtenir une estimation
de la variance de la moyenne long terme de la vitesse du vent, parce quun
changement dans la taille de bloc changera lestimation de la variance de faon
importante. Il serait intressant de tester ici dautres tailles de blocs que celle
propose par Davison et Hinkley (voir par exemple Politis et Romano (1995))
et de tenter de dterminer de quelque faon que ce soit la taille optimale pour
lestimation de la variance de la moyenne long terme estime.

5.5. C ONCLUSION SUR LES PRVISIONS DE LA VITESSE DU VENT


La mthode M CP permet dobtenir des prvisions de la vitesse du vent
dans le pass ainsi quune estimation de la vitesse moyenne du vent long
terme. Dans ce chapitre, on a tent de justifier dans un premier temps lutilisa-
tion des donnes mso-chelle partir de la validation croise. On a dabord
pu voir partir de la validation croise et du calcul de lerreur relative de la
moyenne long terme estime quil tait prfrable dutiliser les donnes mso-
chelle que les donnes provenant dune station de rfrence seules dans un
modle de rgression linaire simple. Cest ce que la compagnie Hatch voulait
dterminer, puisquils nutilisent prsentement que les donnes de station de
rfrence et veulent savoir sil vaut la peine de payer pour des donnes mso-
chelle. Les rsultats ont aussi montr que lerreur due la prvision de la
vitesse du vent dans le pass serait encore davantage diminue si lon utilise
tant les donnes mso-chelle que celles provenant dune station de rfrence
dans un modle de rgression linaire multiple. Ainsi, les donnes de station
de rfrence ne sont pas inutiles et peuvent tre utilises conjointement aux
donnes mso-chelle pour amliorer les prvisions de la vitesse du vent.

Nous avons ensuite prsent une mthodologie, toujours pour estimer lerreur
de prvision mais dans le cas o lon possdait seulement des donnes y ap-
partenant lchantillon dapprentissage (donc seulement les deux dernires
annes, par exemple), cas o on ne peut pas faire de validation croise. Des
blocs derreurs bootstrap ont permis de tenir compte de la dpendance entre
les observations, et des prvisions bootstrap faites partir de rsidus en blocs
de diverses tailles ont permis dobtenir des estimations de lerreur quadratique
93

moyenne de prvision quon a compares celles obtenues par validation croi-


se. Les rsultats nont pas dmontr une grande diffrence quant la taille de
bloc utilise mais on a pu voir une diffrence entre les trois modles de r-
gression linaire, le modle avec tous les prdicteurs ainsi que celui utilisant
seulement les donnes mso-chelle tant ceux qui mnent aux rsultats les
plus similaires par rapport la validation croise o toutes les donnes taient
utilises. En gros, nous avons obtenu des diffrences absolues relatives de la
racine de lEQMP contenues entre 5,78% et 9,69% et cest donc la diffrence
laquelle on peut sattendre lorsquon value la racine de lEQMP partir du
bootstrap par rapport la validation croise.

Finalement, ltude de la variabilit de la moyenne long terme estime par-


tir du bootstrap a montr que la taille des blocs dans le bootstrap influenait
bel et bien lestimation de la variance de la moyenne long terme de la vitesse
du vent estime. On ne connat toujours pas la taille de bloc parfaite mais lon
sait que, vue la diffrence lorsquon fait varier la taille, lhypothse dindpen-
dance entre les observations ne tient pas. Effectivement, les variances pour des
1
tailles de Napp
3
ou de 200 ne sont pas similaires la variance obtenue avec une
taille de 1, correspondant une structure de dpendance de dlai 0, ces pre-
mires variances tant beaucoup plus grandes, comme on peut sy attendre sil
y a de la dpendance dans les donnes temporelles. Ces rsultats vont de pair
avec ceux trouvs dans le chapitre 4, la section 4.4.2.
CONCLUSION

Lestimation de la production dnergie annuelle produite par une turbine


olienne se fait en plusieurs tapes, chacune de ces tapes influenant grande-
ment lestimation de la production dnergie annuelle, ce qui peut donc mener
dimportantes diffrences selon la mthodologie utilise pour lestimation.

Dans le chapitre 3, on a tent de dterminer, dans un premier temps, laquelle


des mthodes dextrapolation de la vitesse du vent mnerait aux meilleures
estimations la hauteur dune turbine olienne classique. On a pu trouver,
partir de lerreur quadratique moyenne dextrapolation, quil ny avait pas
de grande diffrence entre le coefficient de cisaillement local ou global et la
mthode du point de rfrence ou de la rgression. En nutilisant que deux
hauteurs (donc les sites 1 30), on pouvait dj prvoir quil ny aurait aucune
diffrence entre la mthode du point de rfrence et de la rgression avec co-
efficient de cisaillement local. Or, pour le site 31, nous possdions les vitesses
de vent une autre hauteur, de sorte que la mthode de la rgression se distin-
guait maintenant de celle du point de rfrence, mme avec un coefficient de
cisaillement local. On a trouv que les mthodes optimales taient maintenant
celle du point de rfrence avec coefficient de cisaillement local et la hauteur
de rfrence la plus prs du plus haut point et celle de la rgression avec coeffi-
cient de cisaillement local. En plus de tester la prvisions aux dix minutes, on a
voulu valuer lestimation de la moyenne long terme de la vitesse du vent. Les
meilleures mthodes qui en sont ressorties sont celles du point de rfrence ou
de la rgression avec un coefficient de cisaillement local. On ne peut pas dire
que lune des mthodes se dmarque particulirement, mais lon remarque que
lutilisation dun coefficient de cisaillement local semble prfrable celle dun
coefficient global.

Au chapitre 4, on dsirait entre autres valuer la modlisation de la vitesse du


vent par une distribution Weibull. Un test dadquation nous a dabord per-
mis dobserver que pour chacun des 31 sites, les probabilits que la vitesse
96

prenne des valeurs dans les classes de 1 25 m/s ne proviendraient pas dune
loi Weibull. Nous avons ensuite voulu vrifier si un ajustement de Weibull
chaque anne ou mme chaque mois serait prfrable, puisque lindustrie
utilise prsentement une seule distribution globale pour modliser celle de la
vitesse du vent. Pour ce faire, on a valu la variabilit des paramtres ajus-
ts sur des distributions annuelles ou mensuelles et une comparaison de ces
variabilits nous a permis de remarquer, dans un premier temps, que les es-
timateurs de la variance asymptotique et chantillonnale ne menaient pas du
tout aux mmes rsultats, et dans un second temps, partir de simulations
bootstrap, que la dpendance entre les donnes ntait pas ncessairement la
raison des diffrences, mais plutt que lajustement de Weibull globales ou an-
nuelles ne suffisait pas capturer toute la variabilit de la distribution de la
vitesse du vent dans le temps. Aux vues des rsultats, on pense que des para-
mtres mensuels seraient prfrables mais on ne peut en tre sr, entre autres
parce que la dpendance entre les observations na pas t considre dans nos
simulations bootstrap. Finalement, dans ce chapitre, on a aussi voulu comparer
lestimation de la production dnergie annuelle faite partir de la distribution
empirique des vitesses de vent ou de la Weibull ajuste sur les vitesses de vent,
afin de voir quel point la modlisation par la Weibull engendre une diffrence
au niveau de lestimation. On a trouv, pour certains sites, des diffrences de
plus de 6% entre les deux estimations. Cela porte donc rflchir la faon
dont la production dnergie devrait dornavant tre estime.

Dans le chapitre 5, on a utilis la validation croise et le bootstrap afin dva-


luer la variabilit des prvisions du vent dans le pass, puisquil sagit dune
autre composante de lestimation de la production dnergie annuelle dune
turbine olienne. La validation croise nous a permis de trouver que les don-
nes mso-chelle, utilises dans un modle avec deux prdicteurs (celles-ci
en plus des donnes de stations de rfrence), permettaient de diminuer ler-
reur quadratique moyenne de prvision de la vitesse du vent dans le pass.
Nous avons prsent, toujours dans ce chapitre, une mthodologie permettant
dvaluer lerreur de prvision de la vitesse du vent dans le cas o nous ne
possdons pas de donnes mesures dans lchantillon de validation. Cest le
bootstrap par blocs qui nous a permis dvaluer lerreur de cette faon, en plus
de nous permettre de considrer la structure de corrlation entre les vitesses
1/3
de vent. Nous avons trouv, pour des blocs de taille l = Napp , que le modle
deux prdicteurs menait des diffrences relatives absolues moyennes de
5,78% par rapport aux rsultats avec la validation croise, alors que le modle
97

avec donnes mso-chelle menait plutt une diffrence moyenne de 6,50%


et le modle avec donnes de station de rfrence, une moyenne de 9,69%. Ce
sont donc les diffrences dans les racines des erreurs quadratiques moyennes
de prvision auxquelles on peut sattendre en utilisant le bootstrap lorsque
nous navons que quelques annes de donnes disponibles. De plus, le fait de
faire varier la longueur des blocs dans le bootstrap nous a permis de remar-
quer encore une fois quil existe bel et bien de la dpendance entre les vitesses
de vent, puisque les diverses tailles de blocs menaient des rsultats trs dif-
frents en termes de variance de la moyenne long terme estime.

Pour finir, nous croyons quil aurait aussi pu tre intressant de voir les choses
dun autre point de vue, dabord en utilisant ds le dbut des paramtres chan-
geant dans le temps (surtout quil est plausible, vus les rsultats au chapitre 4,
que ce soit prfrable par rapport des paramtres globaux). Nous aurions
donc pu explorer des approches baysiennes o les paramtres sont alatoires.
Dans un deuxime temps, nous aurions aussi pu considrer un point de vue
davantage ax sur les sries chronologiques. En effet, sauf vers la fin du cha-
pitre 4 et dans le bootstrap par bloc au chapitre 5, nous avons considr lin-
dpendance entre les vitesses de vent puisque cela demeurait plus simple que
lajustement de modles de sries chronologiques aux donnes. Dans de fu-
tures tudes, on pourrait donc ajuster des modles de sries chronologiques
aux donnes et tenter de dterminer le dlai pour lequel les vitesses de vent
sont dpendantes entre elles. Cela nous permettrait par la suite dajuster la
mthodologie du chapitre 5 avec des blocs de bonne taille, ou encore de pr-
dire la vitesse du vent passe partir des modles trouvs.

Somme toute, les analyses entreprises dans ce mmoire ont permis de trouver
que lutilisation dun coefficient de cisaillement local plutt que global pour-
rait amliorer lextrapolation de la vitesse du vent, que la modlisation de la
distribution des vitesses de vent par une seule Weibull ne tient pas compte
de la variabilit des paramtres dans le temps et quil faut donc faire davan-
tage attention cette tape puisque des paramtres variant de faon mensuelle
semblent dj tre plus prs de la ralit, quil semble tre prfrable dutiliser
la distribution relle des vitesses de vent pour estimer la production dnergie
plutt que la distribution de Weibull ajuste et finalement, quil pourrait tre
avantageux pour les ingnieurs oliens dutiliser des mthodes tenant compte
de la structure de dpendance entre les vitesses de vent plutt que de consid-
rer les vitesses de vent comme tant indpendantes entre elles lors de lestima-
tion de la production dnergie olienne annuelle.
BIBLIOGRAPHIE

Burton, T., Jenkins, N., Sharpe, D. et Bossanyi, E. (2011). Wind Energy


Handbook, Wiley, Chichester.

Davison, A.C. et Hinkley, D.V. (1997). Bootstrap Methods and Their Application,
Cambridge University Press, Cambridge.

Drobinski, P. et Coulais, C. (2012). Is the Weibull distribution really suited


for wind statistics modeling and wind power evaluation ? arXiv :1211.3853.

Efron, B. (1979). Bootstrap methods : Another look at the jackknife. The


Annals of Statistics, 7, 1-26.

Johnson, N.L., Kotz, S. et Balakrishnan, N. (1994). Continuous Univariate


Distributions, Volume 1, Wiley, New York.

Knsch, H.R. (1989). The jacknife and the bootstrap for general stationary
observations. The Annals of Statistics, 17, 1217-1241.

Peterson, E.W. et Hennessey Jr, J.P. (1978). On the use of power laws for
estimates of wind power potential. Journal of Applied Meteorology, 17, 390-394.

Politis, D.N. et Romano, J.P. (1995). Bias-corrected nonparametric spectral


estimation. Journal of Time Series Analysis, 16, 67-103.

Rice, J.A. (2007). Mathematical Statistics and Data Analysis, third edition,
Duxbury, Berkeley.

Searle, S.R. (1971). Linear Models, Wiley, New York.

http://eolienne.f4jr.org/eolienne_etude_theorique
Consult le 9 dcembre 2013.

http://stat.ethz.ch/R-manual/R-devel/library/stats/
html/optim.html Consult le 17 mars 2014.

http://stat.ethz.ch/R-manual/R-patched/library/stats/
html/00Index.html Consult le 24 aot 2014.

Anda mungkin juga menyukai