Analyse des posts Reddit de la présidentielle 2017
Contexte du projet
Ce projet est mené par Salma Esserghini, Micky-Love Mocombe et Frédéric Lecat dans le cadre du cours du Master 2 D2SN de data visualisation, encadré par Quentin Lobbé.
Objectif du projet & question de recherche
La question que nous nous sommes proposés d’explorer est la suivante :
Quelle est l’évolution des communautés affiliées politiquement (affiliation mesurée par le score et/ou un sentiment positif) en correspondance avec les événements médiatiques (cités dans les soumissions et ou corrélation externe) ?
Pour cela nous sommes passés par plusieurs étapes :
-
une vision analytique textuelle des données Reddit concernant les élections présidentielles de 2017 , incluant l’analyse des sentiments des titres de fils de discussion ainsi que des commentaires,
-
une réflexion sur les algorithmes de score Reddit en lien avec notre question de recherche,
-
la prise de contexte et formation d’hypothèses quant aux influences politiques,
-
une représentation arborescente et interactive des fils de commentaires pour la recherche,
- une visualisation des affiliations politiques qui reflète l’évolution dans le temps des communautés d’utilisateurs (référencés par leur pseudonyme Reddit) autour des candidats, au travers des clusters de commentaires favorables,
- des choix de conception,
- pour tirer un certain nombre de conclusions concernant la question de recherche.
Contexte de la campagne
Selon le Ministère de l’Intérieur, la liste des candidats à l’élection présidentielle 2017, dont l'ordre a été arrêté par tirage au sort, était la suivante :
- M. Nicolas DUPONT-AIGNAN,
- Mme Marine LE PEN,
- M. Emmanuel MACRON,
- M. Benoît HAMON,
- Mme Nathalie ARTHAUD,
- M. Philippe POUTOU,
- M. Jacques CHEMINADE,
- M. Jean LASSALLE,
- M. Jean-Luc MÉLENCHON,
- M. François ASSELINEAU,
- M. François FILLON.
Le projet se construit à partir d’un jeu de données de commentaires Reddit au premier semestre 2017.