Les marques de produits laitiers s’expriment tout au long de l’année sur les réseaux sociaux, cherchant à préempter des territoires d’expression différenciant. Au sein de l’agence The Metrics Factory, nous avons analysé un dataset exhaustif[…]
Dessine moi un tuto !
Il existe mille et une manière de produire un tutoriel. Des marques de tous secteurs et domaines d’activités confondus en diffusent pour accompagner des objectifs de communication variés. The Metrics Factory a analysé un corpus[…]
Portrait des supporters de football sur Facebook
Dans le cadre de mes missions au sein de The Metrics Factory, j’ai pu analyser une corpus exceptionnel composé de plus d’1.5 millions de commentaires Facebook, de supporters de clubs de football de Ligue 1.[…]
Tutoriel – implémenter Stanford CoreNLP avec Talend
Pour compléter le tutoriel sur la détection de la langue d’un message, nous allons maintenant voir comment appliquer des traitements text mining avancés à un corpus, à l’aide de la librairie Stanford CoreNLP. Le groupe[…]
Tutoriel Spotipy – Créer une playlist de recommandations Spotify
N’avez-vous jamais été surpris par la qualité des recommandations de Spotify, une fois l’écoute d’un album terminée ? Le service de streaming dispose de données plutôt riches concernant les titres de son catalogue et peut ainsi créer[…]
Tutoriel text mining avec Talend : détecter la langue d’un message
Ce tutoriel s’adresse à des dataminers ou data scientists qui sont confrontés à une problématique de text mining usuelle : comment identifier la langue d’un message. Ce tutoriel présente une implémentation simple de la librairie[…]
#ComPol – Quels sont les partis politiques les plus influents sur Twitter ?
Cet article s’intéresse aux prises de paroles des principaux partis politiques français, sur Twitter. Comment s’articulent leurs lignes éditoriales ? Que révèlent leurs messages sur leurs prises de position ? Dans quelle mesure sont-ils repris[…]
Superbowl 2016 – Cartographie des conversations
Nous avons cherché à étudier un événement majeur, le Superbowl, l’émission à plus forte audience. Au cours du week end, nous avons constitué un dataset de plus de 47.000 messages et 49.000 retweets. Le graphe ci-dessous présente[…]
Essai de cartographie des blogs musicaux
Tim Berners Lee, inventeur du lien hypertexte, investi le web d’une dimension éminemment sociale. « The web doesn’t just connect machines, it connects also people ». Le lien hypertexte est un vecteur extrêmement puissant permettant de cartographier[…]