Projets informatiques M2 Parcours MSS

Données des fréquences de prénoms

L'objectif de ce projet informatique est de traiter des données libres en utilisant des méthodes de statistiques descriptives et inférentielles vues tout au long de notre formation.

Certains plaisent, déplaisent, indiffèrent, irritent ou encore suscitent les moqueries : bien souvent de façon inconsciente, nous avons une idée préconçue sur les prénoms et sur la possible personnalité de leur porteur. Né de la nécessité d'identifier les citoyens, le prénom est porteur d'une valeur symbolique, il est "l'expression du moi profond de chaque individu". Mais le choix du prénom est-il si arbitraire?

Au travers de données libres mises à disposition sur internet, nous allons tenter de déterminer les éléments qui peuvent influencer le choix d'un prénom.

Table des matières

Les données

  1. La géographie des prénoms

    1.1. Analyse en composantes principales

    1.2. Les prénoms les plus données à travers le temps

  2. L'influence des médias sur nos prénoms

  3. Le prénom comme signe d'appartenance sociale ?

  4. Prénoms et politique

Conclusion

Sources

Les données

Nous avons choisi d'utiliser une base de données contenant à chaque ligne un prénom, son genre, un nombre d’occurrences, un département et une année. Nous avons conjointement trouvé un tableau de contingence entre les départements et les prénoms.

1. La géographie des prénoms

Tout d'abord, nous allons nous demander s'il existe des différences géographiques. Pour cela, nous allons commencer par supprimer les prénoms qui ont été enregistrés moins de 100 fois en 60 ans dans toute la France : les prénoms rares sont potentiellement mal enregistrés et ils pourraient donc biaiser les résultats. Ici, on impose la règle suivante :

# Suppressions des prénoms rares ou avec valeur manquante
filtre <- sapply(prenoms, function(x) {!is.na(sum(x)) & sum(x) > 100})
prenoms <- prenoms[,which(filtre)]

Ensuite nous réalisons un test du khi-deux pour vérifier qu'il existe des différences entre départements :

Pearson's Chi-squared test :

X-squared = 13115000, df = 254550, p-value < 2.2e-16

La valeur associée au test est supérieure à 10 millions et la p-value est à peu près égale à 0. On peut donc conclure avec un faible risque qu’il existe une dépendance entre départements et prénoms utilisés.

Retour à la table des matières

1.1. Analyse en composantes principales

Cependant, ce dernier test ne nous apporte pas d'information sur la nature de cette dépendance. Nous allons donc effectuer une Analyse en Composantes Principales (ACP) afin d'identifier les sources de différence entre départements.

a) Première composante

Avant de calculer les composantes principales, on divise chaque ligne du tableau par le nombre total de personnes nées dans le département. On obtient ainsi la proportion de personnes affublées d’un certain prénom dans un département donné : ce qui nous intéresse, ce n’est pas qu’un grand nombre de personnes portent ou non un nom, mais qu’un prénom soit relativement rare ou non dans une zone géographique.

Voici la liste des 100 prénoms les plus corrélés avec la première composante :

Samy, Yasmine, Amina, Rayane, Adam, Sophia, Mehdi, Soraya, Yacine, Amin, Marwa, Manel, Omar, Sofiane, Elias, Amine, Lina, Kenza, Samia, Anis, Rayan, Ilyes, Iman, Lyna, Sofia, Alia, Hamza, Amir, Asma, Ismael, Amel, Nassim, Walid, Hakim, Sana, Shaima, Ines, Juliana, Riyad, Yasmina, Issam, Farah, Sirine, Rebecca, Nawel, Terence, Ahmed, Lamia, Sara, Syrine, Hana, Sami, Isaac, Oussama, Mohamed-amine, Ryan, Ruben, Mouna, Khaled, Nora, Ilana, Marwane, Djibril, Assia, Naim, Alya, Ranya, Merwan, Soumaya, Malik, Selim, Aya, Sammy, Nabila, Ibrahim, Karim, Jennyfer, Wissam, Anissa, Aicha, Safia, Aaron, Dounia, Eden, Iliana, Kahina, Hanna, Youcef, Aniss, Yanis, Adame, Kim, Halima, Leila, Diana, Karima, Janna, Sephora, Abdel, Lilia

Et la liste des 100 prénoms les plus négativement corrélés :

Gilbert, Gilberte, Odette, Roland, Georgette, Francis, Andree, Pierre, Jeanine, Gilles, Marie-francoise, Marie-christine, Maurice, Elisabeth, Jean-francois, Ghislaine, Rene, Daniele, Marie-france, Gisele, Claudette, Raymond, Marcel, Marie-claire, Liliane, Jeannine, Regine, Pascale, Roger, Patricia, Jean-louis, Lucette, Catherine, Odile, Jean, Raymonde, Jean-pierre, Yolande, Janine, Huguette, Evelyne, Fabienne, Eveline, Veronique, Jean-paul, Andre, Michelle, Marie-claude, Genevieve, Anne-marie, Yvette, Ginette, Jean-claude, Paulette, Michele, Serge, Marie-therese, Dominique, Pierrette, Yves, Joelle, Jean-luc, Eliane, Christiane, Didier, Claudine, Josiane, Viviane, Patrice, Arlette, Danielle, Maryse, Patrick, Joel, Josette, Bernadette, Philippe, Beatrice, Annie, Christine, Thierry, Sylvie, Jacques, Claude, Bernard, Daniel, Colette, Christian, Brigitte, Guy, Gerard, Nadine, Chantal, Nicole, Martine, Monique, Alain, Jacqueline, Francoise, Michel

On remarque de façon quasi immédiate que la plupart des prénoms positivement corrélés avec la première composante sont d’origine étrangère : un grand nombre semble d’origine oriental, mais on trouve également des prénoms anglosaxons (Rebecca, Jennyfer, Kim), hébreux (Adam, Elias, Isaac) ou latins (Juliana, Lilia). A l’inverse, les prénoms négativement corrélés sont tous d’origine française, mais pour beaucoup ont l’air plutôt obsolètes : Gilberte, Georgette, Ghislaine, Ginette, etc. La principale composante opposerait donc d’un côté des régions où de nombreuses personnes portent des prénoms d’origine étrangère et d’un autre côté des régions où l’on rencontre des gens aux prénoms traditionnels, mais vieillots.

Représentons à présent la composante principale sur une carte de France

Sur la carte ci-dessus on observe que les couleurs les plus foncées correspondent aux grandes métropoles françaises.

Cette tendance se retrouve également sur la carte du logarithme de la densité des populations dans chaque département :

On peut expliquer cela par le fait que ces métropoles attirent un grand nombre de personnes issues de l'immigration. Ce phénomène peut s'expliquer par l'attractivité économique de ces villes. Ces dernières représentent peut être un "El Dorado" à leurs yeux.

Cette attraction peut aussi être interprétée sous un autre angle. En effet c'est dans ces villes que les populations sont les plus nombreuses, ainsi il est donc normal que la concentration d'étrangers soit plus forte que dans d'autres villes où les résidents sont moins nombreux. C'est ce que la seconde carte nous confirme.

On peut dire que cette composante différencie très bien les grandes métropoles des campagnes.

b) Deuxième composante

Intéressons-nous maintenant à la seconde composante. Celle-ci capture 10% des différences entre départements, mais que capture-t-elle ? Si l’on représente graphiquement cette composante, on obtient la carte suivante :

Les zones rouges représentent les départements dans lesquels la composante est positive et les zones bleues ceux où elle est négative. On remarque immédiatement que la carte est coupée en deux : une grande partie tous les départements de la moitié nord-ouest sont rouges tandis que ceux de la moitié sud-est sont bleus. En matière d’usage des prénoms, il existerait un clivage entre le nord-ouest et le sud-est.

Les 100 prénoms les plus positivement corrélés avec cette composante sont les suivants :

Corentin, Tiphaine, Anne-Sophie, Eloise, Yohann, Clemence, Tanguy, Matheo, Armelle, Gwendoline, Adelaide, Nolan, Amelie, Steven, Elise, Flavie, Gwenaelle, Louanne, Orlane, Gwladys, Maryvonne, Alban, Adèle, Matthis, Valentin, Anaelle, Coraline, Emeline, Lolita, Lou-Anne, Mickael, Samuel, Agathe, Solenne, Solène, Héloise, Bénédicte, Anne-Claire, Johann, Nolann, Lou-Ann, Titouan, Anne-Charlotte, Louane, Noémie, Mélinda, Karl, Erwan, Morgan, Gaetan, Florentin, Teddy, Elouan, Ludivine, Ophelie, Alexane, Annabelle, Maxime, Anne-Laure, Enola, Justine, Maxence, Maelle, Hugues, Berenice, Marceau, Alan, Aymeric, Rodolphe, Bertrand, Louison, Louann, Pierrick, Romuald, Killian, Clotilde, Constance, Wilfried, Nolwenn, Leandre, Cassandre, Flavien, Typhaine, Noella, Pascaline, Kilian, Anne-Cecile, Donovan, Dimitri, Gwenael, Apolline, Jeannick, Janick, Francois-Xavier, Sullyvan, Jimmy, Melaine, Loanne, Bertille, Malo Antonin, Anne-Francoise, Yvonnick, Anatole, Maeliss, Nolwen, Baptiste, Tifenn

Regardons maintenant les 100 prénoms les plus négativement corrélés :

Robert, Simone, Georges, Serge, Michele, Christiane, Josiane, Marc, Christian, Pierre, Myriam, Andrée, Muriel, Eliane, Georgette, Jean-Marc, Danielle, Aimé, Marguerite, Raymond, Gisèle, Lucien, Maria, Suzanne, Henri, Josette, Rosette, Geneviève, Lucienne, Jeanine, Solange, Henriette, Jean-Louis, Bernard, Anne-Marie, Roland, André, Rose, Jean, Joelle, Renée, Fathia, Marie-Rose, Elisabeth, Sabine, René, Carmen, Roger, Marthe, Carine, Guy, Lionel, Mireille, Nouria, Laurent, Bernadette, Soumia, Zahia, Hassina, Marlene, Malek, Tahar, Mohand, Rachid, Fernand, Fadila, Fadela, Paulette, Zakia, Jeannette, Ikram, Gilbert, Max, Daniele, Raymonde, Hanan, Lisa, Arlette, Jacques, Pierrette, Lahcene, Faouzi, Nicole, Djilali, Mahmoud, Mourad, Souhila, Fethi, Sakina, Baya, Monique, Hayette, Saliha, Denise, Nabil, Yazid, Odette, Marie-Pierre, Houria, Eliette, Mohamed

Le premier groupe comporte des prénoms d'origine celte. Les prénoms du second groupe sont moins homogène que le précédent : on y trouve beaucoup de prénoms chrétiens (Marc, Pierre, Jean, etc.) et quelques prénoms d’origine arabe. Mais on peut surtout remarquer la présence de nombreux prénoms latins : Lucien, Rose, Carmen, Solenge, Sabine, Carine, Laurent…

On peut faire une hypothèse en remarquant que les prénoms corrélés positivements sont ceux qui pourraient être donnés actuellement, ce sont donc des prénoms "jeunes" : Mathéo, Noémie, Jimmy ou encore Anaelle. Ceci peut être expliqué par le fait que ces villes ont une grande concentration d'étudiants comme Paris, Toulouse ou encore Montpellier.

A contrario les prénoms du second groupe sont des prénoms "anciens" ou étrangers.

c) Troisième composante

Voici la liste des 100 prénoms les plus corrélés avec la troisième composante :

Ambroise, Laure-Anne, Mathurin, Constantin, Hermine, Ferdinand, Hector, Hortense, Melchior, Balthazar, Marie-Caroline, Baudouin, Jan, Octave, Rosalie, Ariel, Mahaut, Gaspard, Zachary, Marin, Barnabe, Lancelot, Theodore, Albane, Philomène, Alberic, Elvire, Toscane, Ourida, Robinson, Priscille, Tancrede, Sixtine, Carolina, Colombe, Domitille, Camel, Emile, Blanche, Eugene, Louis, Hippolyte, Anne, Yvonne, Ida, Brune, Malo, Malou, Jean-Eric, Aurèle, Guillemette, Prune, Achille, Lorette, Jean-Gabriel, Brieuc, Vadim, Julio, Penelope, Blaise, Isaure, Albert, Ethel, Javier, Ian, Pierre-Yves, Anatole, Leonore, Marie-Emmanuelle, Nicholas, Jean-Guillaume, Solal, Theophane, Milla, Ava, Gaële, Aristide, Oscar, Irène, Marie-Anne, Leon, Anne-France, Ulysse, Victoire, Gwenola, Servane, Sidonie, Come, Saadia, Alma, Leonard, Anne-Francoise, Anne-Gaelle, Augustin, Albertine, Gildas, Yaelle, Pierre-Olivier, Leopoldine, Yves-Marie

Et la liste des 100 prénoms les plus négativement corrélés :

Émilie, Sebastien, Dylan, Coralie, Séverine, David, Damien, Celine, Melanie, Océane, Aurore, Fabien, Amandine, Jason, Christophe, Jeremy, Élodie, Aurélie, Jérome, Aurélien, Sandrine, Cyril, Angelique, Cédric, Kevin, Ludovic, Cindy, Jordan, Ophélie, Bryan, Théo, Romain, Jimmy, Cloé, Ludivine, Nadège, Florian, Brandon, Laetitia, Cassandra, Anaïs, Virginie, Melissa, Delphine, Alison, Jordy, Quentin, Benjamin, Jessy, Jennifer, Stéphanie, Teddy, Dimitri, Karine, Valentin, Stecy, Mélodie, Alicia, Laurine, Christelle, Kessy, Steffy, Matheo, Kelly, Christopher, Yohan, Jessica, Geoffrey, Tiffany, Kimberley, Enzo, Amélie, Dawson, Julien, Ingrid, Mylène, Lana, Lea, Curtis, Lenny, Stacy, Brenda, Sandy, Manon, Mégane, Sandra, Iness, Nathalie, Wesley, Vanessa, Alexis, Émeline, Joffrey, Johnny, Jonathan, Justine, Vivien, Adeline, Wendy, Tony, Melody

A première vu on a l'impression que les prénoms du premier groupe sont ceux donnés dans le milieu Bourgeois comme Jean-Guilaume ou encore Leopoldine.

Regardons l'évolution du prénom le plus corrélé avec le troisième axe :

Nous constatons que ce prénom est en pleine croissance tout comme d'autres prénoms issus du même groupe. On peut supposer que l'on assiste à un "embourgeoisement" des prénoms voir même de la société.

Les prénoms du second groupe sont issus d'influences médiatiques et sont le plus donné dans le milieu populaire comme Dylan ou encore Vanessa.

Regardons l'évolution du prénom le moins corrélé avec le troisième axe :

Ce prénom a connu un succès, dont nous détaillerons la raison plus tard, mais ce fut qu'un effet de mode car il est en déclin depuis. Les prénoms du second groupe sont "éphémères", ils sont donnés selon un influence alors que ceux du premier groupe sont sont plus une identification sociale.

Un peu plus tard nous nous concentrerons sur le second groupe afin de mettre en évidence l'influence des médias sur les prénoms.

Un autre prénom peut susciter notre curiosité. En effet le prénom Marie semble intemporel. Bien qu'il est décliné au fil du temps, il reste toujours très donné.


Le prénom Marie était déjà très fréquent chez les Juifs à l'époque de Jésus-Christ. Sa diffusion exceptionnelle par la suite dans les cultures judéo-chrétiennes est évidemment due à la sainte Vierge Marie, mère de Jésus. D'abord peu attribué jusqu'au XIe siècle, ce prénom suscitait respect et crainte. Il rencontre par la suite un succès fulgurant. Devenant pendant plusieurs siècles le prénom féminin le plus attribué dans plusieurs langues. Marie est le prénom numéro 1 en France en 1946. Dépassé par d'autres, il se classe à la 7e place dans le top 50 d'aujourd'hui.

Retour à la table des matières

1.2. Les prénoms les plus données à travers le temps

La question naturelle maintenant est de savoir quel est le prénom le plus donné par départements et à une année donnée.

a) Les prénoms de femmes donnés en 1968

On note une grande majorité de départements où Nathalie était le prénom en vogue. Le tout semble plutôt uniforme.

b) Les prénoms de femmes les plus donnés 30 ans après :

Il ne fait aucun doute que les prénoms à la mode ne sont plus les mêmes. Même si le prénom Léa semble être le plus répandu, on remarque une plus grande diversité dans le choix des prénoms.
Tout ceci semble provenir de différentes influences. 30 ans après, le prénom Marie est toujours majoritairement donné en Corse.

c) Les prénoms d'hommes donnés en 1968

Chez les hommes, il n'y avait pas qu'un seul prénoms en vogue, ils étaient trois à se partager le podium : Laurent, Philippe, Christophe. Ces prénoms sont donnés dans des départements limitrophes donc on peut affirmer qu'il existait un effet de mode de proximité. Au sud les deux premiers prénoms énoncés étaient majoritaires alors qu'au nord, le prénom Christophe dominait.

d) Les prénoms d'hommes donnés en 1998

En 1998, les prénoms à la mode ont complètement changé. L'effet de mode de proximité reste cepedant d'actualité car les prénoms dominants sont semblables à des grappes. Thomas, Quentin, Maxime et lucas sont les prénoms qui reviennent le plus cette année là. La distinction nord/sud n'est plus aussi marquée. Ici, 30 ans après, le prénom de Jean n'est plus autant donné en Corse.

Retour à la table des matières

2. L'influence des médias sur nos prénoms

Maintenant nous allons mettre de côté la variable "département" et essayer de mettre en évidence l'influence télévisuelle et radiophonique dans le choix des prénoms.

Ci-dessous, voici le code que nous avons implémenté afin de tracer l'historique d'un prénom. Pour notre exemple, prenons le cas de Zinedine

zinedine <- pre[which (pre$name=="zinedine"),]
zinedine <- aggregate(n ~ year, zinedine, sum)
plot(zinedine$year,zinedine$n,type="l", col="red", 
     main="Nombre de personnes ayant le prénom Zinedine en France par année")


On remarque qu'autour des années 2000, l'utilisation de ce prénom a fortement augmenté et ceci s'explique par le fait que la France a gagné la coupe du monde en 1998 grâce à Zinedine Zidane.


Ici le prénom Elsa connait son apogée à partir de la fin des années 80 et cela correspond à la date à laquelle la chanteuse Elsa Lunghini a débuté sa carrière (1986).


Toujours dans le registre de la chanson, Johnny Hallyday est en 1960, le premier qui popularise le rock and roll dans l'Hexagone. Son prénom est largement utilisé depuis cette date.


Céline est une chanson interprétée par Hugues Aufray. Elle sort en 1966. Avec le succès de la chanson, le prénom Céline devient populaire, et Céline Dion, née en 1968, est prénomée d'après la chanson.

Émilie Jolie est un conte musical de Philippe Chatel arrangé par Jean-Louis Bucchi et sorti en disque en 1979.

Passons désormais à un autre registre, les séries télévisées.


Le prénom Thierry s'est démocratisé après la diffusion de Thierry la Fronde à la télévision française en 1964.


Dylan est un personnage de la série Beverly Hills 90210 diffusée en 1993.


Le Caméléon est une série télévisée américaine diffusée en 1996 dont le personnage principal se nomme Jarod. Ce prénom voit le jour en France à partir de ces années là.

Retour à la table des matières

3. Le prénom comme signe d'appartenance sociale?

Nous allons maintenant entrer plus dans le détail. Nous avons tout d'abord voulu créer deux nouvelles bases qui contiennent les prénoms majoritaires par sexe, années et départements. Pour cela nous avons implémenté un code que vous pouvez aller consulter en cliquant ici

Par soucis de rapidité, nous avons exporté les deux bases créées.

Nos bases sont désormais prêtes à être croisées avec d'autres. En premier lieu, nous avons recherché une base de données contenant les catégories socio professionnelles des départements. Nous avons trouvé une base qui contient ces informations pour les années 1968, 1982 et 1999.

Nous allons voir si les prénoms donnés changent au cours des années et des CSP.

Pour charger ces bases nous avons du nettoyer celles ci et garder l'information qui nous est nécessaire. Après cela il ne nous reste plus qu'à importer les bases précédentes ainsi que les nouvelles.

Nous avons choisi de traiter une CSP par an. Pour l'année 1968, nous avons choisi la catégorie agriculteurs, la catégorie employés pour l'année 1982 et la catégorie cadres pour l'année 1999.

Après exécution de notre code, nous obtenons les prénoms suivants dans les départements où l'agriculture était très présente en 1968 :

Laurent, Jean, Thierry, Isabelle, Natalie

Nous constatons qu'en 1968 les agriculteurs étaient très présents dans l'Aveyron, le Cantal et dans le Gers. Les prénoms de Laurent, Jean, Thierry, Isabelle et Natalie étaient les prénoms les plus donnés en 1968 dans les départements où l'agriculture était majoritaire, donc on peut supposer que ces prénoms étaient donnés à des enfants d'agriculteurs en 1968.

Après exécution de notre code, nous obtenons les prénoms suivants dans les départements où les employés étaient très présents en 1982 :

Christophe, Philippe, Nathalie

Nous constatons qu'en 1982 les employés étaient très présents dans les Yvelines, l'Hérault et dans la Haute Garonne. Les prénoms de Christophe, Philippe et Natalie étaient les prénoms les plus donnés en 1982 dans les départements où les employés étaient majoritaires, donc on peut supposer que ces prénoms étaient donnés à enfatnts d'employés en 1982.

Après exécution de notre code, nous obtenons les prénoms suivants dans les départements où les cadres étaient très présents en 1999 :

Alexandre, Léa, Abigail

Nous constatons qu'en 1999 les cadres étaient très présents à Paris. Les prénoms d'Alexandre de Léa et d'Abigail étaient les prénoms les plus donnés en 1999 à Paris donc on peut supposer que ces prénoms étaient donnés à des enfants d'une classe supérieure en 1999.

Retour à la table des matières

4. Prénoms et politique

Nous nous intéressons maintenant à la "tendance politique" des prénoms. Pour cela nous avons récupéré la base de donnée des candidats aux élections municipales de 2014 et l'avons nettoyé en ne conservant que les individus ayant toutes les informations concernants l'affiliation politique complète. Ensuite, nous avons construit le tableau de contingence entre les prénoms des individus et leur affiliation politique.

Par suite, à l'image de notre premier traitement, nous réalisons un test du khi-deux pour vérifier qu'il existe des différences de prénoms entre les affiliations politiques :

Pearson's Chi-squared test :

X-squared = 8205.5, df = 2032, p-value < 2.2e-16

La valeur associée au test est supérieure à 8200 et la p-value est à peu près égale à 0. On peut donc conclure avec un faible risque qu’il existe une dépendance entre le prénom et la couleur politique à laquelle appartient l'individu portant ce prénom.

Afin d'approfondir cette dépendance, nous effectuons une AFC en mettant les prénoms en tant que variables et les partis politiques en tant qu'individus. Voici les résultats :

On constate que tout d'abord que le plan factoriel représente 82.63% de l'inertie totale du nuage de point, ce qui est une bonne représentation.

Au niveau des profils-lignes, l'Extrême-Droite contribue fortement à la construction du premier axe (80%). Il est de plus bien représenté sur cet axe avec un cosinus carré de 0.987. L'Extrême-Gauche quant à elle, contribue à 72% au second axe et est très bien représenté sur cet axe avec un cosinus carré de 0.96. En terme de distance entre les modalités, il semble que Gauche, Centre et Droite sont proches. Cependant, même si la qualité de la projection de la Droite sur le premier plan est plutôt bonne (0.87), celles de la Gauche et du Centre sont moyennes voire très mauvaises (respectivement 0.49 et 0.06). On peut donc considérer (en prenant des précautions), la proximite des profils Gauche et Droite. Néanmoins ces profils sont proches du centre et donc du profil moyen, leurs informations ne sont donc pas pertinentes.

Nos analyses se porteront donc sur les centres Extrême-Droite et Extrême-Gauche.

Au niveau des profils-colonnes, on peut déjà distinguer les listes de prénoms contribuant le plus aux deux premiers axes.

La proximité est difficile à appréhender étant donné la quantité de modalités.

Afin d'établir une liste des prénoms qui sont proches de l'Extrême-Droite et une liste de ceux qui sont proches de l'Extrême-Gauche, nous prenons les coordonnées des prénoms les plus proches de ces appartenances politiques sur le premier plan factoriel.

Liste des "prénoms d'Extrême-Droite"

Germaine, Louis, Jeanne, Renée, Odette, Henriette, Mauricette, Simone, Rolande, Paule, Marguerite, Raymonde, Andrée, Marcelle, Marie, Kevin, Yvonne, Georgette, Jonathan, Paulette, Joséphine, Yvette, Quentin, Gabrielle, Rose, Angèle, Madeleine, Suzanne, Lucienne, Thérèse, Micheline, Jeannine, Carmen, Boris, Kévin, Ginette, Antoinette, Jessica, Gaston, Geoffrey, Janine, Lucette, Adrien, Huguette, Mario, Gerard, Louis, Victor, Mickael, Tony

Liste des "prénoms d'Extrême-Gauche"

Mohamed, Rachid, Malika, Ali, Ahmed, Karim, Mohammed, Mehdi, Samia, Fatima, Elsa, Nadia, Farid, Karima, Saïd, Simon, Abdelkader, Nora, Boris, Claire, Leïla, Mustapha, Fatiha, Sarah, Samira, Hugo, Elise, Marianne, Alice, Mathilde, José, Claudine, Hélène, Xavier, Camille, Germaine, Marie-José, Jean-Marie, Nicolas, Manuel, Sophie, Elodie, Marion, Hugo, Ariane, Line, Chloé, Jocelyn, Lise, Julia

Nous sommes en présence deux groupes différents. En effet le premier groupe est composé de prénoms largement donnés autour des années 1950. On peut donc affirmer que les personnes du premier groupes sont, pour la majorité, des français agés de plus de 50 ans. C'est ce qui pourrait caractériser les membres de l'extrême droite.

Pour le second groupe, nous constatons la forte présence de prénoms d'origine étrangère. On retrouve également des prénoms de "jeunes" donnés récemment. Peut être que les mesures visant à intégrer les étrangers sont une motivation pour adhérer à ce parti.

Conclusion

Nous avons donc pu voir que les prénoms ne sont pas donnés aléatoirement. Ils représentent une appartenance sociale qui nous démarque. Cette attribution est souvent le résultat d'une influence, ou effet de mode, qui peut être médiatique mais aussi religieuse ou même familiale. Si nous avions eu l'opportunité de "scroller" le web par le bais d'un algorithme afin de récupérer les résultats au BAC ansi que les prénoms des candidats, nous aurions pu créer une base de données très intéressante à exploiter. Ceci pourrait faire l'étude d'un prochain projet.

Sources

Article du journal des femmes, Juillet 2014

Structure de la population active, Janvier 2014

Les candidats aux municipales par communes, Avril 2014

Prénoms, départements et analyse en composantes principales, Avril 2011

Retour à la table des matières