Projets informatiques M2 Parcours MSS

INTRODUCTION

L'objectif de ce projet informatique est de traiter des données libres (open data) en utilisant des méthodes de statistiques descriptive et inférentielle vues tout au long de notre formation.

Selon l’Insee, le taux de chômage baisse de 0,1 point par rapport au troisième trimestre 2015. Au travers des données libres disponible sur internet, nous allons tenter de représenter la répartition des chômeurs sur toute la France et déterminer les éléments qui contribuent à l'évolution de leur nombre.

Quelques définitions

Signification des différentes catégories de chômeurs en France:

Définition:

Le taux de chômage est le pourcentage de chômeurs dans la population active (actifs occupés + chômeurs). On peut calculer un taux de chômage par âge en mettant en rapport les chômeurs d'une classe d'âge avec les actifs de cette classe d'âge. De la même manière se calculent des taux de chômage par sexe, par région, par nationalité, par niveau de diplôme...

Définition:

La part des chômeurs est la proportion de chômeurs dans l'ensemble de la population. Cet indicateur est plus faible que le taux de chômage qui mesure la proportion de chômeurs dans la seule population active. Il est utilisé pour nuancer le très fort taux de chômage parmi les jeunes de moins de 25 ans. Comme beaucoup de jeunes sont scolarisés et que relativement peu ont un emploi, leur taux de chômage est très élevé alors que la proportion de chômeurs dans la classe d'âge est beaucoup plus faible.

DESCRIPTION ET PRETRAITEMENT DES DONNEES

Récupération des données

Nous avons à notre disposition des données qui portent sur les demandeurs d'emploi inscrits en fin de mois à Pôle emploi par catégorie, sexe et tranche d'âge, ancienneté, et par zone d'emploi entre Janvier 1996 et Décembre 2016. Les données sont arrondies à la centaine. Il faut savoir que les demandeurs d'emploi sont inscrits à Pôle emploi selon 5 catégories: A, B, C, D et E, que nous avons définies plus haut. Afin de calculer les indicateurs comme le taux de chômage ou la part du chômage, nous avons récupéré également des données de population, essentiellement, par département et par région, sur différents sites que nous donnons à la fin du rapport. ### Choix d'études

Dans les médias et pour le gouvernement, on catégorise comme chômeurs seulement les inscrits de la catégorie A. Si il est assez logique d'exclure les inscrits des catégories D et E, ne pas compter les inscrits des catégories B et C est considéré par certains comme une manière de dégonfler les chiffres du chômage. Ainsi, on considèrera, sauf mention du contraire, le nombre d'inscrits des catégories A,B et C (et parfois, seulement ceux de la catégorie A).

Mise en forme des données

Pour bien visualiser la répartition du nombre de demandeurs d'emploi en France par département sur une période donnée, nous avons tracé des cartes de la France. Mais comme les départements dans notre base de données de départ ne sont pas classés de la même manière que ceux de la base de données permettant de tracer les frontières, alors il nous a fallu réordonnée nos données.

STATISTIQUE DESCRIPTIVE

Cette partie est subdivisée selon le point de vue. On représentera d'abord la répartition des chômeurs selon leurs caractéristiques (catégorie, genre et âge) sur la France entière. Puis nous nous intéresserons aux différences de nombre de chômeurs entre les départements. Enfin, nous utiliserons cette réprésentation par département pour visualiser une évolution temporelle du chômage.

Répartition des chômeurs selon les caractéristiques

Tranche d'âge et sexe

Dans le détail, en proportion, ce sont les demandeurs d'emploi de 50 ans ou plus qui pâtissent le plus de la hausse du chômage des catégories A, B et C. Entre decembre 2015 et décembre 2016, on a environ 7 000 chômeurs supplémentaires. Viennent ensuite les moins de 25 ans, on y observe . Le nombre de demandeurs d'emploi chez les 25-49 ans, lui, augmente par rapport à novembre 2016 , soit environ 1 000 chômeurs en plus.

A noter qu'en decembre 2016, les hommes subissent une hausse du chômage moins importante que les femmes.

Nouspouvons voir également que 2009 semble être un bouleversement décisif dans le monde de la recherche d'emploi. Les tendances qui avaient l'air stables auparavants changent et/ou sont globalement à la hausse.

Les chômeurs en France selon la catégorie


Toutes catégories de demandeurs d'emploi confondues, la plus forte hausse concerne les chômeurs de catégorie D c'est-à-dire ceux qui sont sans emploi et non tenus de faire des actes positifs de recherche d'emploi. Les demandeurs d'emploi de catégorie C, qui regroupe les demandeurs d'emploi tenus de faire des actes positifs de recherche d'emploi et ayant exercé une activité réduite de plus de 78 heures au cours du mois, voient quant à eux leur nombre diminuer en décembre 2016.

La catégorie A constitue l'essentiel des inscrits, avec plus de 3,5 millions d'inscrits en 2016. L'évolution du nombre d'inscrits reflète une observation faite précédemment : il augmente beaucoup à partir de 2009. A noter qu'il avait tendance à diminuer jusque là. Cependant, on a aussi des inscrits dans les quatre autres catégories, pour 2,7 millions d'inscrits en 2016. Entre 2005 et 2015, le nombre de chômeurs de catégorie E a doublé, et on constate une hausse pour les catégories B et C à partir de 2009.

Point de vue des départements

## OGR data source with driver: ESRI Shapefile 
## Source: "Andriamihaingo-Tauzia/DEPARTEMENT", layer: "DEPARTEMENT"
## with 96 features
## It has 11 fields

On voit ici la répartition du nombre de chômeurs. Cette représentation est biaisée par le fait que certains départements sont plus peuplés que d'autres. On va maintenant représenter la part du chômage dans chaque département en décembre 2016 en utilisant les derniers chiffres du recensement.


Cette carte montre la part du chômage pour décembre 2016. Il est intéressant de constater qu'on a une part importante de chômage au Nord et au Sud, mais que beaucoup de départements du centre semble avoir une part de chômage plus basse.

Pour avoir un élément de comparaison, on peut aficher la même chose pour décembre 2009


Si le chômage est globalement moins élevé, la répartition que l'on a constaté avant est la même. On aimerait maintenant faire plusieurs cartes pour observer une possible évolution du chomage pour la France.

Evolution du nombre de chômeurs

Le problème de ce genre de carte est qu'il est difficile de comparer deux cartes pour deux années proches. On va donc ici faire des cartes qui montre les variations du taux de chômage pour chaque département. On pourra ainsi constater les départements dans lesquels le chômage progresse le plus par exemple. On utilisera ici la part moyenne des chômeurs pour chaque année.


On a ici la carte des parts du chômage en 2015 et en 2016, et on voit que les données sont très semblables. Tentons de visualiser maintenant les parts du chômage en 2008 et en 2016, en utilisant la même échelle de couleurs.
On voit bien que le chômage a augmenté partout. Mais ce graphique n'est toujours pas très parlant pour comprendre l'évolution du chômage.


Là, on voit vraiment où le chômage a beaucoup progressé. Au Sud et dans quelques départements au Nord, on voit que le chômage a beaucoup augmenté.


Les départements du Sud-Est et du Sud-Ouest sont ceux dans lesquels le chômage augmente le plus. Globalement, le Nord-Est s'en sort bien, le chômage y progresse moins, voir recule.

STATISTIQUE INFERENTIELLE

Le chômage sous les différents présidents de la République

## [1] 636


Nous observons que des trois derniers présidents de la République que la France a eu, c'est N. Sarkozy qui affiche les meilleurs résultats en termes d'emploi. En février 2008, le taux de chômage en France métropolitaine est à son plus bas depuis janvier 1996. C'est 2,5 points de moins qu'au troisième trimestre 2016. Le plus faible nombre de chômeurs de catégorie A depuis 1996 a lui aussi été enregistré sous le prédécesseur de François Hollande, en février 2008.

Variables exogènes

Pour essayer d'expliquer le nombre de chômeurs dans chaque département, nous avons choisi d'utiliser deux variables exogènes depuis le site de l'INSEE, la création d'entreprise et la défaillance d'entreprise (Voir liens ci-dessous). Les données de l'INSEE sont des données mensuelles depuis janvier 2000 jusqu'à décembre 2016, ce qui nous donne 204 données mensuelles pour chacun des 96 départements.

Lien pour les données de Creation d'entreprise

Lien pour les données de Défaillance

Pour évaluer l'influence de ces deux variables sur le nombre de chômeurs, nous avons choisi de diviser les données pour chaque département par leur population. On peut alors comparer les données entre les départements. Pour commencer, faisons une ACP sur les données de Décembre 2016.


Il est intéréssant de constater que les 3 variables sont corrélées positivement, et que la part du chômage et la création d'entreprise sont corrélées négativement. Ce qui paraît logique. Prenons maintenant en compte toutes les données de 2016.


On constate des corrélations presque identiques. Faisons la même chose pour l'année 2012, pour voir si ses corrélations sont spécifiques à 2016.


On constate encore une fois que les corrélations entre les trois variables sont identiques. On peut conclure cette suite de graphiques en disant qu'il y a une corrélation indépendante du temps entre le chômage et la défaillance et la création d'entreprise.

CONCLUSION

Pour conclure, les études que nous avons effectuées nous ont permis de voir l'évolution du chômage en France entre 1996 et 2016, selon la tranche d'âge, le sexe ou encore la catégorie. Nous avons également pu observer, pour un moment donné, cette évolution au niveau des départements. Ce qui a été plutôt intéressant car cela nous a permis de voir que le taux de chômage augmente le plus au Sud, ce qui n'est pas le cas au Nord. Cela nous a par la suite poussé à déterminer des éléments qui pourraient expliquer ces différences. On s'est donc focalisé sur les variables création et défaillance d'Entreprises.

Ce qui aurait été intéressant, c'est d'essayer d'expliquer la hausse ou la baisse du taux de chômage en fonction de la situation géographique d'un demandeur d'emploi. C'est-à-dire, essayer de trouver les déterminants spatiaux de l’exclusion sur le marché du travail.

REFERENCES