Introduction

Une inégalité est une différence d’accès, entre plusieurs individus ou groupes, à une ressource. Les inégalités économiques sont constatées sur la base des inégalités de revenus et de patrimoine. Dans ce rapport, nous allons nous intrésser à l’étude portant sur le niveau des inégalités de richesses entre les pays du monde au travers de l’évolution historique des inégalités de revenu et de patrimoine dans le monde. Dans ce sillage, nous allons intresser aux pays de l’OCDE. L’Organisation de coopération et de développement économique (OCDE) a, en 1961, succédé à l’Organisation européenne de coopération économique (OECE), fondée en 1948 pour gérer l’aide américaine d’après-guerre. L’OCDE regroupe plus d’une trentaine de pays : toute l’Europe occidentale et l’Amérique du nord, plus le Japon, l’Australie, la Nouvelle-Zélande, la Corée et, depuis 1995 et 1996, certains pays d’Europe centrale (République tchèque, Hongrie, Pologne) et, depuis 2010 le Chili, la Slovénie, Israël, et l’Estonie. L’OCDE est le principal rassembleur de statistiques sur les pays développés. L’OCDE siège à Paris. Dans ce projet, nous allons nous intrésser d’abord, à quelques analyses descriptives disponible au site http://ses.ens-lyon.fr/fichiers/Articles/diaporama-chancel-cycle-uo-2018-2019.pdf. En suite, nous allons étudier certaines variables qui influent sur l’évolution de ces inégalités. En fin nous allons nous intéressé aux prédictions de l’évolution de ces inégalités. Les données qui seront utilisé au cour de ce rapport sont téléchargeables aux sites https://wid.world/fr/accueil/ et https://data.oecd.org/fr/.

I-Analyse l’évolution des inégalités

I-1) Revenu des 10% les plus aisés en 2019

I-1-1) Dans le monde

Nous allons produire un diagramme de la part dans le revenu national des 10% les plus aisés dans le monde

## [1] 0.5175

En 2019, la part du revenu national allant aux seuls 10% des plus gros revenus (part de revenu du décile supérieur) était de 51,75%.

## Full amcharts.js API available using amChartsAPI()
## Look at rAmCharts::runExamples() & http://datastorm-open.github.io/introduction_ramcharts/
## Bug report or feed back on https://github.com/datastorm-open/rAmCharts

I-1-2) Dans les pays de l’OCDE

Nous allons produire maintenant un diagramme de la part dans le revenu national des 10% les plus aisés des pays de l’OCDE.

Les inégalités sont très différentes d’une région à l’autre. En 2019, la part du revenu national allant aux seuls 10% des plus gros revenus (part de revenu du décile supérieur) était plus faibles dans les pays comme République tchèque, Islande, Slovénie, Slovaquie, Pays-Bas avec moins de 30%. Elle était plus forte successivement dans les pays comme les États-Unis, Israël, Colombie, Turquie, Mexique, Swaziland et Chili.

Maintenant nous allons nous intéresser à l’évolution de ces inégalités de 1980 à 2019

I-2) Evolution de la part des 10% les plus aisés de 1980 à 2019

I-2-1) Dans le monde

## 
## Attaching package: 'highcharter'
## The following object is masked from 'package:lmtest':
## 
##     unemployment

I-2-2) Dans certains pays de l’OCDE

Depuis 1980, les inégalités augmentent presque partout, mais à des rythmes différents. En Colombie et au Chili, les inégalités de revenus sont restées relativement à des niveaux très élevés. Les inégalités de revenus ont augmenté rapidement en Amérique du Nord, en Corée, mais de manière plus modérée en Europe. En Chili, l’inégalité augmente à l’approche du 21ème siècle.

II- Analyse des composantes principales

Pour une vision d’ensemble du comportement des inégalités par localités ainsi que par indicateurs de richesses, nous choisissons de faire une analyse des composantes principales afin d’illuster la dynamique d’évolution des inégalités dans les pays de l’OCDE

## Loading required package: ggplot2
## Welcome! Want to learn more? See two factoextra-related books at https://goo.gl/ve3WBa

III) Étude prévisionnélle de l’évolution de l’inégalité

III-1) Europe

II-1-1) Saisonnalité, Autocorrélation et Ergodicité de la série

Le chronogramme est une représentation graphique d’une variable quantitative en fonction du temps. Dans notre étude, il prédit l’existence d’une tendance variable. Autrement dit la part des 10% plus aisés du monde augmente de 1980 à 2000 et décroissant au-delà de 2000. Le corrélogramme c’est le graphique de la fonction d’autocorrélation délimité par un intervalle de confiance nous permettant de savoir si les coefficients d’autocorrélations sont nuls ou pas. L’étude du corrélogramme nous permet de voir que la fonction d’autocorrélation totale décroît très lentement et tend vers zéro (elle ne décroît pas de manière exponentielle). Néanmoins les coefficients d’autocorrélation restent proches de 1 pour un très grand nombre de retards. Nous avons donc une série issue d’un processus probablement non stationnaire qui présente une autocorrélation et elle semble être ergodique c’est-à-dire que la mémoire du processus est limitée dans le temps.

II-1-2) Stationnarité du revenude la part des 10% les plus aisés et tests de Racine Unitaire :

Un processus est stationnaire au second ordre si ces deux moments sont invariants dans le temps. Autrement dit, un processus est stationnaire au second ordre si : -Son espérance est indépendante du temps \(∀t∈Z, E[X_t]=m\) -Sa variance est finie \(∀t∈Z, E[X^2_t]=cste\) Son autocovariance au retard \(h\) est indépendant du temps \(∀t,h∈Z, Cov(X_t-X_{t-h})=E(X_t)\)

-Tests de Racine Unitaire : Ce test nous permet de vérifier si la série est stationnaire ou pas. Il permet aussi d’étudier de quel type de non stationnarité il s’agit. Car selon le type de non stationnarité que l’on a, les méthodes de les stationnariser ne sont pas les mêmes. Une mauvaise stationnarisation nous conduit à des régressions fallacieuses voire des résultats trompeurs. Nous allons utiliser le test de Dickey-Fuller

-Test de racine unitaire de Dickey-Fuller:

Nous avons les trois modèles suivant : (modèle 3: avec constante et avec tendance) (1) \(Y_t= \beta_0+ \beta_1t + \rho Y_{t-1} + \epsilon_t\) (modèle 2: avec constante et sans tendance) (2) \(Y_t= \beta_0+ \rho Y_{t-1} + \epsilon_t\) (modèle 1: sans constante et sans tendance) (3) \(Y_t=\rho Y_{t-1} + \epsilon_t\)

Hypothèse du test: \(H_0\) : \(\rho=1\) présence de racine unitaire, non stationnaire \(H_A\) : \(\rho<1\) absence de racine unitaire, Stationnaire

La statistique de test:

\(\cal T=\frac{\hat{\rho}}{\hat{\sigma}_p}\)

Règle de décision :

Si la statistique de test est inférieure au \(\cal T\) alors on rejette l’hypothèse nulle \(H_0\) Sinon on est enclin à l’accepté. Le \(\cal T\) est la valeur lu sur la table de student à \((n-k)\) degré de liberté. Pour mettre en œuvre ce test, nous avons choisi un nombre de retard égal à zéro en prenant le modèle 3 (avec constante et tendance déterministe) (1).

## 
## ############################################### 
## # Augmented Dickey-Fuller Test Unit Root Test # 
## ############################################### 
## 
## Test regression trend 
## 
## 
## Call:
## lm(formula = z.diff ~ z.lag.1 + 1 + tt)
## 
## Residuals:
##        Min         1Q     Median         3Q        Max 
## -0.0073862 -0.0013829 -0.0001515  0.0016787  0.0048060 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)
## (Intercept)  1.630e-03  1.575e-02   0.103    0.918
## z.lag.1      5.048e-03  5.280e-02   0.096    0.924
## tt          -9.215e-05  1.058e-04  -0.871    0.389
## 
## Residual standard error: 0.002679 on 36 degrees of freedom
## Multiple R-squared:  0.1159, Adjusted R-squared:  0.06676 
## F-statistic: 2.359 on 2 and 36 DF,  p-value: 0.109
## 
## 
## Value of test-statistic is: 0.0956 5.5377 2.3592 
## 
## Critical values for test statistics: 
##       1pct  5pct 10pct
## tau3 -4.15 -3.50 -3.18
## phi2  7.02  5.13  4.31
## phi3  9.31  6.73  5.61
  • Commentaires et interprétations:

Nous observons que la p-value de beta 1 est supérieur à 0.05 donc nous acceptons l’hypothèse nulle,

On voit que la statistique de test (t-value) de \(\rho-1\) est supérieur aux t tabulé : nous acceptons encore l’hypothèse nulle qui nous dit que \(\rho-1\) n’est pas significatif ce qui implique que la série ne présente pas une racine unitaire, elle est donc stationnaire La p-value est le plus petit seuil de significativité pour lequel on est enclin à ne pas rejeter l’hypothèse nulle. Si la p-value est inférieure à α on rejette l’hypothèse nulle sinon on est enclin à l’accepter au seuil \(\alpha\)., nous avons choisi un seuil de 5% comme risque de première espèce.

Pour que le test de Dickey Fuller soit valide il faut nécessairement que les aléas soient non corrélés. Les aléas ou résidus ou innovations correspondent à la partie non prévisible du processus.

Les fonctions d’autocorrélations totales et partielles montrent que les innovations sont corrélées entre elles.

II-1-3) Meilleur modèle :

##           [,1]      [,2]      [,3]      [,4]      [,5]      [,6] [,7]
## [1,] -338.1000 -336.7634 -336.9555 -336.5998 -343.5679 -342.9965    0
## [2,] -337.8836 -337.4318 -335.4318 -337.8818 -342.3673 -341.0504    0
## [3,] -336.7681 -335.4318 -333.7542 -336.3207 -340.4652 -339.1878    0
## [4,] -335.0504 -333.4396 -337.2616 -334.6639 -338.7844 -337.7820    0
## [5,] -341.9257 -341.1391 -339.1464 -337.8702 -338.8132 -337.2313    0
## [6,] -342.1077 -340.1077 -338.1114 -339.5204 -337.8126 -335.8211    0
## [7,]    0.0000    0.0000    0.0000    0.0000    0.0000    0.0000    0
##      row col
## [1,]   1   5

II-1-4) Prédiction :

II-2) Canada

II-2-1) Saisonnalité, Autocorrélation et Ergodicité de la série

Le chronogramme est une représentation graphique d’une variable quantitative en fonction du temps. Dans notre étude, il prédit l’existence d’une tendance variable. Autrement dit la part des 10% plus aisés du monde augmente de 1980 à 2000 et décroissant au-delà de 2000. Le corrélogramme c’est le graphique de la fonction d’autocorrélation délimité par un intervalle de confiance nous permettant de savoir si les coefficients d’autocorrélations sont nuls ou pas. L’étude du corrélogramme nous permet de voir que la fonction d’autocorrélation totale décroît très lentement et tend vers zéro (elle ne décroît pas de manière exponentielle). Néanmoins les coefficients d’autocorrélation restent proches de 1 pour un très grand nombre de retards. Nous avons donc une série issue d’un processus probablement non stationnaire qui présente une autocorrélation et elle semble être ergodique c’est-à-dire que la mémoire du processus est limitée dans le temps.

II-2-2) Stationnarité du revenude la part des 10% les plus aisés et tests de Racine Unitaire :

Un processus est stationnaire au second ordre si ces deux moments sont invariants dans le temps. Autrement dit, un processus est stationnaire au second ordre si : -Son espérance est indépendante du temps \(∀t∈Z, E[X_t]=m\) -Sa variance est finie \(∀t∈Z, E[X^2_t]=cste\) Son autocovariance au retard \(h\) est indépendant du temps \(∀t,h∈Z, Cov(X_t-X_{t-h})=E(X_t)\)

-Tests de Racine Unitaire : Ce test nous permet de vérifier si la série est stationnaire ou pas. Il permet aussi d’étudier de quel type de non stationnarité il s’agit. Car selon le type de non stationnarité que l’on a, les méthodes de les stationnariser ne sont pas les mêmes. Une mauvaise stationnarisation nous conduit à des régressions fallacieuses voire des résultats trompeurs. Nous allons utiliser le test de Dickey-Fuller

-Test de racine unitaire de Dickey-Fuller:

Nous avons les trois modèles suivant : (modèle 3: avec constante et avec tendance) (1) \(Y_t= \beta_0+ \beta_1t + \rho Y_{t-1} + \epsilon_t\) (modèle 2: avec constante et sans tendance) (2) \(Y_t= \beta_0+ \rho Y_{t-1} + \epsilon_t\) (modèle 1: sans constante et sans tendance) (3) \(Y_t=\rho Y_{t-1} + \epsilon_t\)

Hypothèse du test: \(H_0\) : \(\rho=1\) présence de racine unitaire, non stationnaire \(H_A\) : \(\rho<1\) absence de racine unitaire, Stationnaire

La statistique de test:

\(\cal T=\frac{\hat{\rho}}{\hat{\sigma}_p}\)

Règle de décision :

Si la statistique de test est inférieure au \(\cal T\) alors on rejette l’hypothèse nulle \(H_0\) Sinon on est enclin à l’accepté. Le \(\cal T\) est la valeur lu sur la table de student à \((n-k)\) degré de liberté. Pour mettre en œuvre ce test, nous avons choisi un nombre de retard égal à zéro en prenant le modèle 3 (avec constante et tendance déterministe) (1).

## 
## ############################################### 
## # Augmented Dickey-Fuller Test Unit Root Test # 
## ############################################### 
## 
## Test regression trend 
## 
## 
## Call:
## lm(formula = z.diff ~ z.lag.1 + 1 + tt)
## 
## Residuals:
##       Min        1Q    Median        3Q       Max 
## -0.024456 -0.004090 -0.000190  0.005058  0.020095 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)   
## (Intercept)  0.1511397  0.0442025   3.419  0.00158 **
## z.lag.1     -0.4604223  0.1348271  -3.415  0.00159 **
## tt           0.0009444  0.0002981   3.168  0.00313 **
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.009225 on 36 degrees of freedom
## Multiple R-squared:  0.2455, Adjusted R-squared:  0.2036 
## F-statistic: 5.857 on 2 and 36 DF,  p-value: 0.006276
## 
## 
## Value of test-statistic is: -3.4149 4.1065 5.8574 
## 
## Critical values for test statistics: 
##       1pct  5pct 10pct
## tau3 -4.15 -3.50 -3.18
## phi2  7.02  5.13  4.31
## phi3  9.31  6.73  5.61
  • Commentaires et interprétations:

Nous observons que la p-value de beta 1 est inférieur à 0.05 donc nous rejettonsl’hypothèse nulle,

On voit que la statistique de test (t-value) de \(\rho-1\) est inférieur aux t tabulé : nous rejettons encore l’hypothèse nulle qui nous dit que \(\rho-1\) n’est pas significatif ce qui implique que la série ne présente pas une racine unitaire, elle est donc stationnaire La p-value est le plus petit seuil de significativité pour lequel on est enclin à ne pas rejeter l’hypothèse nulle. Si la p-value est inférieure à α on rejette l’hypothèse nulle sinon on est enclin à l’accepter au seuil \(\alpha\). Dans le cadre de notre projet, nous avons choisi un seuil de 10% comme risque de première espèce.

Pour que le test de Dickey Fuller soit valide il faut nécessairement que les aléas soient non corrélés. Les aléas ou résidus ou innovations correspondent à la partie non prévisible du processus.

Les fonctions d’autocorrélations totales et partielles montrent que les innovations sont corrélées entre elles..

II-2-3) Meilleur modèle :

## Warning in log(s2): production de NaN

## Warning in log(s2): production de NaN

## Warning in log(s2): production de NaN

## Warning in log(s2): production de NaN

## Warning in log(s2): production de NaN

## Warning in log(s2): production de NaN

## Warning in log(s2): production de NaN
##           [,1]      [,2]      [,3]      [,4]      [,5]      [,6] [,7]
## [1,] -245.2129 -243.6555 -245.8470 -245.2877 -243.6628 -241.6658    0
## [2,] -243.8946 -247.0396 -245.4575 -243.5404 -243.0805 -239.6759    0
## [3,] -242.1361 -245.5348 -241.9976 -242.7601 -241.1704 -240.1866    0
## [4,] -240.3689 -241.9008 -241.4410 -239.0854 -239.6571 -238.1958    0
## [5,] -239.9421 -241.6000 -239.4709 -239.5822 -238.9083 -237.9159    0
## [6,] -238.8111 -239.8375 -239.2963 -237.5700 -237.0335 -235.8231    0
## [7,]    0.0000    0.0000    0.0000    0.0000    0.0000    0.0000    0
##      row col
## [1,]   2   2

II-2-4) Prédiction :