Projets informatiques M2 Parcours MSS

Package rWBclimate


Introduction

rWBclimate est une interface R pour les donnees de la Banque Mondiale du climat, utilisees dans le Climate Change Knowledge Portal, accessible ici: http://sdwebx.worldbank.org/climateportal/. Ce package donne acces a trois classes de donnees, a deux echelles spatiales differentes. Les trois classes de donnees sont:
- les donnees simulees a l'aide de modeles MCG (Modeles de Circulation Generale)
- les donnees d'ensembles
- les donnees historiques

Chaque classe permet de telecharger des donnees de quatre types (voir plus bas) pour les deux variables suivantes:
- les precipitations, en millimetres
- la temperature, en degres Celsius

Les donnees

Les classes de donnees

Presque toutes les donnees du modele de l'API de donnees climatiques sont issues de 15 Modeles de Circulation Generale (MCG) utilises par le Groupe d'experts intergouvernemental sur l'evolution du climat (GIEC). Les modeles simulent la reponse du systeme climatique mondial a l'augmentation des concentrations de gaz a effet de serre.
Remarque: Ces donnees sont des estimations des changements de temperatures et de precipitations dans differentes periodes de temps sous differents MCG et differents scenarios. Elles incluent des previsions de changements pour le futur mais egalement du "backcasting" (modeles de representation du passe) pour les periodes anterieures (le passe). Ces dernieres ne doivent pas etre confondues avec des donnees mesurees ou observees.

Les types de donnees

Les donnees peuvent etre recuperees sous quatre formats:
- Monthly average: la moyenne mensuelle pour les 12 mois d'une periode de temps donnee
- Annual average: la moyenne annuelle pour une periode de temps donnee
- Monthly anomaly: Variation mensuelle moyenne (anomaly). La periode de controle est de 1961 a 1999 pour les variables de temperature et de precipitation
- Annual anomaly: Variation annuelle moyenne. La periode de controle est de 1961 a 1999 pour les variables de temperature et de precipitation

Echelle de temps des donnees

Les donnees du modele climatique sont uniquement disponibles sous forme de moyennes pour des periodes de 20 ans. Le package convertit automatiquement toutes les donnees de debut et de fin de periode dans des appels d'API valides. Seules les periodes suivantes sont disponibles:

Passe Futur
1920-1939 2020-2039
1940-1959 2040-2059
1960-1979 2060-2079
1980-1999 2080-2099

Echelle spatiale des donnees

Les donnees sont disponibles a deux echelles spatiales. La premiere est l'echelle du pays: on peut telecharger les donnees pour tous les pays du monde en utilisant un code de pays ISO 3 lettres. La seconde est l'echelle du bassin (equivalent du continent).

Utilisation des donnees

Les donnees d'un modele sont telechargees pour deux scenarios: A2 et B1. En general, les scenarios A2 sont ceux ou il y a peu de differences entre l'avenir et maintenant, et B1 est un monde plus ecologique avec une plus grande diminution des emissions.
Les deux scenarios seront telecharges pour 15 modeles MGC differents.
Les donnees d'un modele peuvent etre telechargees avec deux fonctions principales:

get_model_temp() ## Recupere les donnees de temperature du modele
get_model_precip() ## Recupere les donnees de precipitation du modele

Vous trouverez ici une courte etude sur les differents modeles de prediction.

Dans la suite de l'etude, nous utiliserons les donnees du modele bccr_bcm2_0.


Problematique

A partir de ces donnees, l'objectif de notre projet est, dans un premier temps, d'etudier l'evolution du climat (passee et future) et de comprendre son impact dans un second temps.

I- Etude de l'evolution du climat

Pour commencer, nous allons etudier les donnees de temperature et de precipitation afin d'etudier l'evolution du climat

Nous avons decide de traiter les donnees en les regroupant par continents.

1. Evolution de la temperature

1.1. Evolution historique

Rappel: Ces donnees ne sont pas de veritables donnees historiques mais des estimations faites par "backcasting".
Elles peuvent etre telechargees avec la fonction suivante:

get_historical_temp() ## Recupere les donnees de temperature "historique"

Cette fonction nous retourne, pour chaque pays, la temperature moyenne annuelle de 1901 a 2012.

A l'etude des donnees, nous avons remarque de nombreuses donnees manquantes a partir de 2010 (pour tous les continents, pouvant atteindre 15 donnees manquantes (sur 36 au total) pour le continent Nord-Americain). voir code

Nous allons donc travailler uniquement sur la periode 1901-2009. Nous avons decide de traiter ces donnees en les regroupant par continents. Pour cela, nous avons calcule la moyenne des temperatures de chaque pays par annee. Au final, on obtient donc les temperatures moyennes annuelles, sur la periode 1901-2009, pour chaque continent. voir code


La courbe noire represente les donnees de temperatures moyennes annuelles. La courbe rouge correspond a la tendance generale de ces donnees. Cette tendance generale est obtenue a l'aide de la fonction stat_smooth(). Ici, cette fonction effectue une regression polynomiale locale "adequate".
On remarque que la forme de la tendance est quasiment identique pour tous les continents : on observe une legere augmentation de la temperature entre 1901 et 1940, une baisse de 1940 a 1970 puis une augmentation plus accentuee jusqu'en 2009.

Boxplot

Ce boxplot est effectue sans regroupements : les donnees par pays et par annees sont directement traitees sans calculs prealables (pas de calculs de moyennes par an).
A partir de ce boxplot, on peut voir la diversite des temperatures historiques moyennes annuelles sur un meme continent. Ainsi, en Amerique du Nord par exemple, on s'apercoit que la majorite des pays ont des donnees de temperatures tres proches/identiques, mais avec quelques pays faisant exception tels que le Groenland ou le Canada (ce sont les valeurs extremes).

Ci dessous, les boxplots par continents realises a partir des temperatures annuelles moyennes (regroupement des pays):

Ces boxplots nous permettent de voir que certains continents ont connus des temperatures particulierement differentes, comme par exemple l'Europe, dont les valeurs sont comprises entre 7.5 et 9.5, soit pres de 2 degres d'ecart au cours de la periode 1901-2009. A l'inverse, d'autres continents tels que l'Amerique du Sud ou l'Oceanie observent une plage de valeurs plus restreintes de moins de 1 degre.

Carte de l'evolution des temperatures annuelles entre 1901 et 2009

Pour une meilleure visualisation de l'evolution de la temperature, nous avons realise cette carte interactive (pour la voir faire clique droit puis ouvrir dans un nouvel onglet):

carte

La carte du haut est statique : elle represente les temperatures pour l'annee 1901. Le curseur en haut a gauche permet de changer d'annee afin de voir l'evolution sur la seconde carte.

1.2. Evolution future

Pour cette partie, nous utilisons les donnees d'anomalie de temperature recuperees a partir de la fonction:

get_model_temp(locator,"annualanom",2020,2100) ## Recupere les donnees de temperature predites par les modeles entre 2020 et 2100 par periode de 20 ans

A l'aide de la fonction subset(), on selectionne les donnees du modele souhaitees (pour rappel, ici bccr_bcm2_0), puis pour chaque tranche de 20 ans, on calcule la temperature moyenne du continent (locator). On repete cette operation pour les deux scenarios A2 et B1 afin de pouvoir les comparer. On obtient les graphiques suivants:

On peut dire, d'apres ces graphiques, que les deux scenarios sont d'accord sur le fait que la temperature moyenne va augmenter dans les prochaines annees. Le scenario B1 est toutefois plus mesure et prevoit une augmentation moins importante avec au maximum +2 degres pour l'Europe entre 2080 et 2100; tandis que le scenario A2 monte jusqu'a quasiment +4 degres pour l'Europe et +3 degres pour les autres continents.

Boxplot


A la lecture de ces boxplots, on retrouve les resultats lus sur les graphiques d'evolution des anomalies de temperature : l'Europe va connaitre le plus grand changement et l'Amerique du Nord le plus faible. Le changement entre les scenarios reside principalement dans le changement de l'echelle : comme toujours B1 est plus mesure que A2

La variance, que l'on peut lire pour les continents, est due au fait qu'il peut y avoir des pays qui disposent d'evolutions de temperature tres differentes sur un meme continent (voir exemple ci dessous).

Sur ce graphique, on peut lire l'evolution de l'anomalie de temperature de deux pays europeens: l'Islande et la Finlande. Malgre le fait que ces pays appartiennent au meme continent, on constate qu'il y a un ecart important dans la prediction de l'evolution de leur anomalie de temperature. Ceci explique la variance inter-continent.

En conclusion de cette partie:

On constate une augmentation de la temperature depuis 1901 sur tous les continents. Pour le futur, les modeles de previsions prevoient egalement une poursuite de ce rechauffement dont l'ordre varie sensiblement selon les scenarios : le scenario A2, soit celui qui estime la teperature si l'on ne change rien par rapport a aujourd'hui, prevoit un rechauffement plus eleve que le scenario B1, qui estime que le monde sera plus eco-responsable.

1.3. Similitude des pays par la temperature

Il peut etre interessant de savoir quels sont les pays qui se ressemblent d'un point de vue des temperatures annuelles. D'apres les etudes precedentes, il semble evident que des pays proches geographiquement se ressemblent en terme d'evolution de temperatures annuelles. Cependant, il se peut que d'autres pays, plus eloignes, se comportent de la meme maniere.
Dans cette partie, nous prendrons comme pays de reference le Portugal et nous nous interesserons a savoir quels sont les pays qui lui ressemblent, ou au contraire s'opposent, en terme d'evolution de temperature annuelle (pour la voir, faire clique droit puis ouvrir dans un nouvel onglet).
carte correlation
Portugal

On remarque que, pour toutes les annees, les pays ayant une temperature annuelle proche de celle du Portugal se situent majoritairement en Europe et Moyen-Orient. Mais on note egalement une ressemblance des pays plus eloignes comme l'Argentine, l'Uruguay, le Perou ou l'Afrique du Sud.


2. Evolution des precipitations

2.1. Evolution historique

Rappel: Ces donnees ne sont pas de veritables donnees historiques mais des estimations faites par "backcasting".
Elles peuvent etre telechargees avec la fonction suivante:

get_historical_precip() ## Recupere les donnees de precipitation "historique"

Cette fonction nous retourne, pour chaque pays, les precipitations moyennes annuelles de 1901 a 2012. De meme que pour les donnees de temperatures historiques, les donnees de precipitations ont de nombreuses valeurs manquantes a partir de 2010.voir code

Nous avons donc decide de ne garder que la periode 1901-2009 pour l'etude.
Nous avons traite ces donnees en les regroupant par continents. Pour cela, nous avons calcule la moyenne des precipitations de chaque pays par annee (voir code).
Au final, on obtient donc les precipitations moyennes annuelles, sur la periode 1901-2009, pour chaque continent. voir code


La courbe noire represente les donnees de temperatures moyennes annuelles. La courbe rouge correspond a la tendance generale de ces donnees. Cette tendance generale est obtenue a l'aide de la fonction stat_smooth(). Ici, cette fonction effectue une regression polynomiale locale "adequate".
On ne peut pas dire qu'il existe ici une tendance globale : chaque continent varie en terme de precipitations sans ressemblances particulieres.

Boxplot

Ce boxplot est effectue sans regroupements : les donnees par pays et par annees sont directement traitees sans calculs prealables (pas de calculs de moyennes par an).
A partir de ce boxplot, on peut voir la diversite des precipitations historiques annuelles moyennes sur un meme continent. Ainsi en Europe, on s'apercoit que la majorite des pays ont des donnees de precipitation tres proches, a l'exception de quelques valeurs extremes plus importantes.
A l'inverse, en Oceanie, on observe une disparite beaucoup plus importante, avec de nombreuses valeurs extremes tres importantes (pays au milieu de l'ocean pacifique nord: Guam, iles mariannes,Nauru...).

Ce second boxplot a ete realise a partir des precipitations annuelles moyennes pour tout un continent (regroupement des pays). Il nous permet de voir que certains continents ont connu des precipitations particulierement differentes (presence d'un forte variance), comme par exemple l'Amerique du Nord, dont les valeurs sont comprises entre 130 et 220 soit pres de 90mm d'ecart au cours de la periode 1901-2009 (la valeur 220 correspond a l'annee 1901, mais pas de problemes dans les donnees : meme nombre de pays...). A l'inverse, d'autres continents tels que l'Asie ou l'Europe observent une plage de valeurs plus restreintes de moins de 20mm.

Carte de l'evolution des precipitations annuelles entre 1901 et 2009

Pour une meilleure visualisation de l'evolution des precipitations , nous avons realise cette carte interactive (pour la voir faire clique droit puis ouvrir dans un nouvel onglet):

carte

La carte du haut est statique : elle represente les precipitations pour l'annee 1901. Le curseur, en haut a gauche, permet de changer d'annee afin de voir l'evolution sur la seconde carte.

2.2. Evolution future

Pour cette partie, nous utilisons les donnees d'anomalies de precipitation recuperees a partir de la fonction:

get_model_precip(locator,"annualanom",2020,2100) ## Recupere les donnees de precipitation predites par les modeles entre 2020 et 2100 par periode de 20 ans

A l'aide de la fonction subset(), on selectionne les donnees du modele souhaitees (pour rappel ici bccr_bcm2_0), puis pour chaque tranche de 20 ans, on calcule les precipitations moyenne du continent (locator). On repete cette operation pour les deux scenarios A2 et B1 afin de pouvoir les comparer. On obtient les graphiques suivants:

On remarque bien que le scenario A2 (pas de changements par rapport a aujourd'hui) est plus "pessimiste" en prevoyant une forte augmentation des precipitations en Oceanie (jusqu'a +100mm ) et une forte decroissance des precipitations en Amerique du Nord avec jusqu'a -50mm de precipitation pour les periodes 2060-2080 et 2080-2100 (en moyenne).
Le scenario B1 rejoint les conclusions du scenario A2 mais en etant plus "raisonable": il s'accorde sur l'augmentation des precipitations moyennes annuelles en Oceanie mais "seulement" jusqu'a +80 mm. De plus la decroissance des precipitations en Amerique du Nord est plus nuancee: le scenario prevoit une baisse entre 2020 et 2040 puis se stabilise plus ou moins autour de 0, ce qui signifie que, d'apres les previsions, les precipitations ne varient plus beaucoup apres 2060.

Boxplot

Ces boxplots de previsions sont en accord avec les donnees historiques: l'Oceanie est le continent avec la plus grande variance de precipitation: autant certains pays font voir leurs precipitations annuelles baissees de 100mm, autant d'autres auront plus de 200mm de pluie en plus par an.
On remarque egalement que certains pays d'Afrique et d'Asie vont perdre pres de 200mm de pluie par rapport a leur moyenne annuelle de la periode 1961-1999.
Le changement entre les scenarios reside principalement dans le changement de l'echelle : comme toujours B1 est plus mesure que A2.

2.3. Similitude des pays par les precipitations

Il peut etre interessant de savoir quels sont les pays qui se ressemblent d'un point de vue des precipitations annuelles.
Dans cette partie, nous prendrons comme pays de reference le Portugal et nous nous interesserons a savoir quels sont les pays qui lui ressemblent, ou au contraire s'opposent, en terme d'evolution de precipitations annuelles (pour la voir faire clique droit puis ouvrir dans un nouvel onglet).

carte correlation
Portugal

Ici au vu du decoupage en classes effectue par R, nous ne pouvons conclure quand a d'eventuelles similitudes avec le Portugal en terme de precipitations annuelles. En revanche, on peut distinguer les regions qui lui sont peu similaires: tout d'abord, les regions aux fortes precipitations comme l'Oceanie, l'Amerique Centrale ou l'Afrique Centrale (principalement les regions du proche de l'equateur) et les regions aux faibles precipitations comme les pays froids (Canada, Russie) ou le Sahel et l'Afrique du Nord.


II- Impact de l'evolution du climat

Etude de cas particuliers

1.1. Secheresse au Sahel

Fin des annees 1960 et debut des annees 1970, le Sahel (principalement Mauritanie, Mali, Tchad et Niger) a ete touche par une grande secheresse. Cela se lit sur les graphiques de precipitations ci dessous : on observe une diminution nette et importante des precipitations dans ces pays sur cette periode.

Quel impact a eu cette secheresse sur la production cerealiere dans ces pays?

Nous avons recupere des donnees de production cerealiere de 1961 a 2010 sur le site data.gouv. Ces donnees sont telechargeables ici. Ces donnees sont en tonnes metriques et portent sur les recoltes de grains secs uniquement.
Nous avons croise les donnees de precipitation de ces quatres pays avec leurs donnees de rendements de cereales.
Pour croiser ces donnees, nous avons choisi de les representer sur un meme graphique afin de voir s'il existe un lien clair entre elles.

Sur ces graphiques, on peut lire les precipitations annuelles en millimetres (axe des ordonnees a gauche), ainsi que l'evolution de la production cerealiere en tonnes (courbe rouge, axe des ordonnees a droite). La ligne noire represente la moyenne globale sur la periode 1901-2012.
MALI: La variation de precipitation au moment de la secheresse (1968-1972 environ) est faiblement perceptible : en 1968, les precipitations s'elevent a 25.8mm contre 31.5 en 1967, puis une seconde diminution a lieu en 1972 ou l'on passe de 26.7mm a 22.7mm (la moyenne sur la periode 1901-2012 est de 28.8mm).
On remarque que l'impact sur la production de cereales intervient en 1972: la production chute de 143.9 tonnes passant de 831.4 tonnes a 687.9. L'annee suivante, en 1973, la production de cereales reste aussi basse avec 673.4 tonnes produites.

NIGER: Le Niger est l'un des pays ou les precipitations sont les plus faibles (environ 15mm par an). Sur le graphique, on observe clairement la secheresse a partir de 1968, lorsque les precipitations annuelles tombent sous la moyenne globale. Sur la periode de 1968 a 1973, les precipitations moyennes annuelles sont de 12.3mm.
La repercussion sur le rendement de cereales est assez evidente sur le graphique: a partir de 1968 et jusqu'en 1974, la production est tres faible, atteignant son point le plus bas en 1973 avec seulement 324 tonnes de cereales.

TCHAD: Au Tchad, la moyenne des precipitations entre 1901 et 2012 est de 29mm. Ici encore, entre 1968 et 1974 les precipitations annuelles passent sous la moyenne globale, avec une annee 1973 particulierement seche (22.4mm).
Au niveau du rendement de cereales, si le pays a "resite" jusqu'en 1970, la production a connu une chute importante entre 1970 et 1972 passant de 705t a 482t.

MAURITANIE: La Mauritanie a la plus faible moyenne globale de precipitations : 8.6mm par an en moyenne. En consequence, sa production cerealiere est la plus faible de toutes celles etudiees ci-dessus avec environ 400t par an (en moyenne).
La secheresse de 1968 a 1974 a eu un effet important sur la production de cereales allant jusqu'a la reduire de moitie. En effet, en 1969 la production etait de 399t. En 1971 et 1972, les precipitations annuelles ne s'elevaient respectivement qu'a 7.9mm et 7mm. En consequence, la production a donc chute et atteint le seuil le plus bas en 1971 avec 206t produites et 209t en 1972.

En conclusion, on peut dire que la secheresse des annees 1968 a 1974 a eu un impact fortement negatif sur la production de cereales dans le Sahel, et cela a conduit a une grande famine.
On pourrait donc, a partir des donnees de precipitations, construire un outil permettant de prevoir la baisse de la production de cereales et ainsi anticiper le manque et limiter une eventuelle famine.

1.2. Types d'arbres en Amerique du Nord

Les donnees que nous allons utilisees ici viennent du package spocc de R, et plus precisement du package rgbif importe avec. Ce package permet de rechercher et recuperer des donnees a partir du Global Biodiverity information Facilty (GBIF). Elles contiennent, entre autres, des donnees sur des types d'arbres d'Amerique: nom scientifique, longitude, latitude...
A partir de ces donnees, nous allons voir s'il existe un lien sur la localisation des types d'arbres en fonction de la temperature du territoire. Pour cela, nous allons etudier l'Amerique Centrale et les Etats-Unis sur la periode 1990-2000. Nous avons travaille sur 200 arbres, appartenant a 8 especes differentes, tirees aleatoirement dans le package.

carte

Sur cette carte, on distingue des regroupements de types d'arbres selon la temperature. Ainsi, un arbre comme le American Larch preferant une temperature plutot faible ne se retrouvera pas en Amerique Centrale: il se concentre dans le nord-est des Etats-Unis.
Pour avoir une meilleure vision de cette repartition, nous avons realise le boxplot suivant:

boxplot

D'apres ce graphique, on peut dire que la plupart des arbres tolerent une variation de temperature de l'ordre d'environ 5 degres. On remarque que les especes Sugar Mapple et Quaking Aspen sont celles qui presentent les plus grandes variabilites de temperature car ce sont les plus dispersees. Cela se verifie sur la carte. En effet, l'espece Quaking Aspen s'etend sur toute la cote ouest des Etats-Unis et une partie de l'interieur des terres. Cette large repartition englobe plusieurs regions de differentes temperatures. On retrouve la meme repartition pour l'espece Sugar Mapple mais sur la cote est des Etats-Unis.
A l'inverse, Mangrove shrub est l'espece qui observe la plus petite variabilite de temperature (la plus petite dispersion). En effet, on la retrouve uniquement sur la region la plus chaude de la carte (Amerique centrale), hormis une ou deux valeurs "extremes" se trouvant dans un environnement moins chaud.

Remarque/Conclusion: A la suite de cette analyse, le but etait de voir l'evolution de la localisation des types d'arbres en fonction de l'evolution de la temperature. Malhereusement, les donnees du package ne sont disponibles valables que pour la decennie 1990-2000.


Conclusion Generale

Ce projet nous a permis de mettre en evidence un rechauffement climatique amorce depuis de nombreuses decennies. De plus, les modeles de previsions MGC sont tous unanimes quand au fait que ce rechauffement va se poursuivre (voir s'accentuer selon le scenario pris en compte) dans les annees a venir.
Ce changement climatique, aussi bien de temperature que de precipitation, a de nombreuses consequences neagtives. Pour notre part, nous avons demontre qu'il etait a l'origine de la secheresse, dans le Sahel entre autre, mais il existe bien evidemment d'autres problemes: la fonte des glaces (entrainant la montee des eaux), l'augmentation du nombre de cyclones, typhons etc.
La suite de ce projet est d'essayer de voir s'il existe un lien entre temperature et precipitation. De plus, nous aurions aime trouver plus de donnees exploitables afin d'expliquer d'autres consequences du changement climatique. Par exemple, concernant la partie sur les especes d'arbres en Amerique du Nord, nous aurions voulu etudier l'evolution de la localisation des differents arbres.

Bibliographie