Le 24 avril 2022, à côté des applaudissements au pied de la Tour Eiffel, des émeutes et des manifestations se sont explosées dans plusieurs lieux de Paris, Marseilles, Lyon. Selon les statistiques, le second tour de l’élection présidentielle est marqué par le deuxième taux d’abstention le plus élevé sous la Cinquième République. Bien que Macron sorte par triompher, un article dans le Figaro a fait remarquer que ” Macron n’est pas porté par aucun enthousiasme populaire ” et Macron a avoué lui-même dans le discours de victoire que beaucoup sont ceux qui ont voté non pour soutenir ses idées mais pour faire barrage à l’extrême droite. On comprend que l’opinion de chaque individu diffère grandement.
Est-ce que vous avez une idée assez claire sur l’opinion des autres en défandant la vôtre ? Cet article cherche à vous présenter un peu l’opinion générale sur Twitter en ce qui concerne la présidentielle 2022 et en même temps à vous apprendre à obtenir un nombre énorme de données à l’aide de l’Octoparse qui est un outil de web scraping.
Discussion sociale concernant la présidentielle 2022 sur Twitter
1.1 La présidentielle 2022
L’élection présidentielle française de 2022 a eu lieu les 10 et 24 avril, conformant à la règle que le premier tour doit prendre le début 20-35 jours avant la fin du dernier quinquennat. La compagne officielle a commencé le 28 mars et dès lors, des débats ou entretiens télévisés ont été orgnisés. Si un candidat gagne une majorité absolue dans le premier tour, il sera élu au poste, sinon, les deux candidats les plus votés passent au deuxième tour qui se tient 14 jours plus tard. Pendant ce temps, les deux candidats se rencontrent sur le débat d’entre-deux-tours. Ce dernier a tombé le 20 avril en cette année.
Il s’agit d’une des plus importantes affaires politiques en France et les candidats ne se fatiguent à donner des discours, à participer à des débats, à énoncer leurs pensées. Et donc, voilà un débat national où divers opinions se confrontent toujours.
1.2 La discussion de la présidentielle sur Twitter
On a mis en application un outil de web scraping – Octoparse pour extraire de Twitter des données concernant la présidentielle 2022.
Selon Googletrends :
a) pendant les douze derniers mois, le volume de recherche du mot-clé ” présidentielle ” a commencé à augmenter soudainement le 27 mars, un jour avant la compagne officielle.
b) pendant les 30 dernières journées, le volume de recherche a atteint son pic le 10 avril
c) pendant les 7 dernières journées, cet indicateur a réalisé deux apogées qui tombaient respectivement les 20 et 24 avril.
C’est très claire que ces dates correspondent justement à des stades critiques de la présidentielle : la campagne officielle, le premier tour, le débat d’entre-deux-tours, le deuxième tour. Par conséquent, afin de mieux concentrer sur les sujets les plus discutés, on se limite à extraire des données qui se forment autour de ces dates critiques.
Plus clairement, on va extraire les données qui se produisaient le 27-29 mars, le 9-11 avril, le 19-21 avril, le 23-24 avril. Notre objectif est de montrer de quoi parle le public quand on parle de la présidentielle.
Des hashtags
On va récupérer premièrement les hashtags ayant trait à la présidentielle. Les étapes sont comme le workflow suivant.
Le scraping a eu lieu à onze heures du 26 avril.
Octoparse a réussi à collecter quatre catégories de hastags.
Curieux de lire tous les tags ?
Puisque Macron est élu au post de président et qu’il devient le cible de beaucoup de discussions maintenant, on va concentrer notre analyse davantage sur des tags qui le concernent.
Le tableau suivant présente tous les hashtags récupérés à propos de Macron et ceux négatifs sont mis en rouge.
A travers le list, on découvre que les hashtags négatifs représentent une partie de plus en plus importante dans tous les hashtags à propos de Macron et que le ton s’intensifie au fur et à mesure que la présidentielle entre dans l’étape suivante.
Des posts
Dans cette partie, le modèle gratuit Tweets et commentaires Scraper fourni par l’Octoparse est mis en application. Il suffit de déterminer ces paramètres suivants et de cliquer sur le bouton de ” Exécuter ” pour commencer l’extraction des posts à la une. Les étapes sont beaucoup moins complexes que l’extraction de hashtags et à vrai dire, ce processus n’exige aucun savoir à propos du web scraping.
Parmi ces hastags, on a choisi #MacronDegage, #TousContreMacron, #ToutSaufMacron et a fixé le nombre de fois de ” scroll down ” à 10 pour amener l’extraction de posts connexes. Plus d’un mille de données sont récupérées (la liste complète des posts )
Les données collectées comprennent le mot-clé, l’url du site, l’url du post, le nom de l’auteur, l’url de la page personnelle de l’auteur, le temps de la publication du tweet, le contenu du tweet, l’url des images et du vidéo, le nombre de Likes, de Retweet, de Reviews. Voici un exemplaire.
Le plus souvent, on étudie les posts en faisant référence à trois critères : le nombre de likes, de retweets, et de commentaires. Si Like signifie une reconnaissance de la part du lecteur, Retweet veut dire que le lecteur est tout à fait d’accord à tel point qu’il retweet le post en guise de sa propre opinion, c’est aussi un critère pour évaluer ou prévenir la portée de diffusion. Quant à Commentaire, cela veut dire que le post mérite une attention et une discussion.
Prenons pour exemple le hashtag #ToutSaufMacron, parmi les 401 top posts collectés, celui qui a le nombre de commentaires le plus élevé est comme le suivant.
Pour ceux qui ont l’envie d’étudier profondément la discussion en analysant les textes de retweets, un autre modèle Avanced Researche fourni par Octoparse est à leur service.
Si on est intéressé par les paroles d’un certain internaute et veut savoir davantage sur lui, on peut avoir recours au modèle Twitter Auteur Scraper pour collecter les tweets qu’il a publiés avant pour comprendre totalement sa façon de réflexion et son attitude envers des affaires publiques.
On s’y limite ici. Pour ceux qui veulent savoir davantage sur la présidentielle ou d’autres sujets d’actualité, veuillez télécharger l’Octoparse qui offrira une réponse à tous les problèmes possibles.
Source importante des données – les réseaux sociaux dans l’ère d’Internet
2.1 Les réseaux sociaux pénètrent dans la vie de chacun
Les réseaux sociaux réunissent une majorité d’hommes et les mettent en connexion. Selon les stastistiques mises à jour le mars 2022 sur https://www.similarweb.com/fr/top-websites/ , parmi les cinq sites les plus visités, quatre appartiennent aux réseaux sociaux.
Le nombre d’utilsateurs des réseaux sociaux est incroyable. Une majorité écrasante des habitants sur cette Terre s’y retrouvent pour partager, lire, discuter. Les raisons de ce choix ne sont pas trop compliquées :
a) les nouvelles s’y transmettent rapidement
b) les messages circulent au-delà du groupe et peuvent être lus par des étrangers
c) un grand nombre de personnes y disent leurs réflexions et les idées se confrontent
d) des visuels sont souvent ajoutés au text, c’est intéressant, divertissant et attrayant
e) les utilisateurs peuvent se tenir au courant de l’actualité
C’est aussi là où réside la valeur des données sur les réseaux sociaux. Ici, on reprend les idées dans cet article à propos des trois atouts de l’opinion publique Internet : opinion pure et spontanée des internautes (sans présupposé dû au questionnaire) ; dépasser les frontières entre qualitatif et quantitatif ; exhaustivité.
2.2 Les modèles susceptible de scraper les réseaux sociaux
Pour ces réseaux sociaux populaires, l’Octoparse a construit beaucoup de modèles, dans l’envie de satisfaire tous les besoins de ses utilisateurs. Il suffit de cliquer sur quelques boutons pour acquérir des données à grande échelle. Allez visiter cette page pour savoir davantage qu’est-ce que les modèles et comment les utiliser.
Ici, je cite les modèles d’extraction de Twitter et pour les autres réseaux média, je vous laisse les découvrir vous-même. Veuillez télécharger l’Octoparse et commencer votre découverte.
Outil exceptionel aidant à recueillir l’opinion publique – Octoparse
3.1 L’opinion publique et sa plurialité
L’opinion publique désigne l’ensemble d’idées ou avis de la masse envers des évènements politiques ou sociales, des actualités, des sujets grandement discutés, des produits commercials, etc. L’opinion publique s’écrit aussi en pluriel ” opinions publiques ” et quand le premier souligne un sens commun, le dernier met en accent la plurialité des avis de chaque individu dans la société. Chaque individu nourrit des opinions, d’autant que l’esprit critique, la démocratie, la liberté et la liberté d’expression sont toujours recherchés, encouragés depuis le siècle des Lumières. A ces jours-là, les philosophes ou les hommes de littérature se réunissaient dans les salons et les cafés pour dire leurs idées sur le gouvernement, la société et la religion. Cette tradition se prolonge et devient maintenant une habitude interne de chaque personne. Tout le monde se précipite d’exprimer ses idées, d’où la plurialité de l’opinion publique et ses caractéristiques importantes : nombreuse, différente, compliquée.
3.2 L’importance de l’analyse de l’opinion publique
Contrairement aux anciens temps où on discutait sur quoi que ce soit au sein de son groupe, les internautes d’aujourd’hui dans l’ère de Web ont affranchi le seuil établi par le temps et la distance et ont l’occasion de s’exprimer dans un plus grand espace qui est publique et délimité. En un mot, les opinions se transmettent rapidement et dans un grand réseau. Ainsi, connaître l’opinion publique et l’analyser deviennent très importants pour ceux qui ont des affaires avec l’opinion publique ou ceux qui veut en profiter.
Lockle a souligné la force et la versalité de l’opinion publique. Cette remarque fait penser à un maxime chinois ” Le gouverneur, c’est le bateau ; le peuple, c’est l’eau. Quand l’eau peut supporter le beteau, il peut aussi le renverser “. Cette phrase élucide merveilleusement la relation entre l’opinion publique et le succès d’un gouverneur ou on peut l’étendre aux autres domaines, tels que l’industrie du commerce : dans ce cas-là, il s’agit de la relation entre les avis clients et le succès d’une marque commerciale.
Qu’il s’agisse de produit ou de service, les commerçants ne réalisent aucun profit sans la reconnaissance des consommateurs. C’est aussi pourquoi les commerçants d’autrefois avaient l’habitude de payer un grand nombre d’argent à confier à des agences de faire des sondages pour étudier l’opinion des clients. Cela, en réflétant davantage la perception des consommateurs qui ont de la marque elle-même, se diffère des commentaires sur les plateformes d’e-commerce car les derniers visent à un certain produit. Par conséquent, l’opinion publique exerce une influence plutôt sur la construction de l’image de marque. Le niveau de discussion est l’un des indicateurs de l’attention attribuée à cette marque par le public ; et ces avis négatifs ou positifs constituent le guide du travail postérieur ; donc surveiller les avis permet de prévenir des accidents horribles et de réduire au minimun des dégats possibles.
Pourquoi avez-vous besoin de ces données ? Ou comment en profiter ? Voici une réponse de la part de l’Octoparse.
3.3 Octoparse – outil exceptionnel de recueillir l’opinion publique
L’opinion publique d’aujourd’dui sur l’Internet se présente sous la forme de millions de données disponibles en ligne sur les réseaux sociaux, les forums, les blogs, etc.
Les données de la sorte se multiplient explosivement. Premièrement, les média traditionnels comme télévision, journal, magazine continuent de se développer tandis que les nouveaux média s’explosent, permettant à chacun d’émettre ses opinions sur Internet, d’autant plus que les réseaux sociaux renforcent davantage cette tendance. Deuxièmement, chacun son idée envers une même affaire à cause de la différence de leur famille, éducation, métier, attitude, etc. On déduit la conclusion que pour saisir complètement et justement l’opinion publique, il est nécessaire d’avoir à la main un grand nombre de données.
Mais avez-vous l’un de ces problèmes ?
Ici, un outil de web scraping est indispensable et je vous recommende l’Octoparse qui vous aidera à obtenir des données sans effort. Ses atouts sont comme suivant :
Des canaux multiples l’Octoparse est spécialisé dans la collecte de Twitter, Facebook, Youtube, Linkedin, Instagram, etc.
Divers champs de données comme auteur, post, nombre de like, commentaires et partage, temps de publication, agrégation de nouvelles pertinentes par mots-clés et plus encore.
Extraction planifiée qui permet aux uitlisateurs d’obtenir les dernières informations. L’extraction planifiée marche également sur le Cloud et on n’a pas besoin de faire fonctionner l’ordinateur ni le logiciel.
Allez scraper !
发表回复