Collecte de données

Tout d’abord, pour analyser un réseau, il est nécessaire de collecter les données relatives à ce dernier pour pouvoir le construire. Twitter fournit une API qui permet de collecter ces données, grâce au langage de programmation Python. Ainsi, pour le réseau propre à un compte Twitter, il va être récupérer l’intégralité de ses followers et de leurs informations (followers respectifs, nombre de tweets, date de création du compte…). Ces informations sont stockées dans une base de donnée qui sera utilisée par la suite.

Collecte de données
Filtrer les données

Filtrer les données

Dans un second temps, il faut filtrer la base de donnée brute récupérée afin de supprimer les données non pertinentes pour notre analyse, comme des comptes inactifs ou encore des comptes avec très peu de followers. L’ordre des filtres n’est pas anodin car ils suppriment des comptes, ce qui modifie la disposition du réseau.

Construction du réseau

La base de donnée filtrée permettra la construction d’un réseau pertinent en vue de l’analyse. Chaque compte twitter représente un noeud du réseau, et chaque relation entre noeuds représente un lien. Il est possible d’établir des relations entre noeuds selon des conditions : si au moins un noeud suit l’autre, alors il y a un lien entre ces deux noeuds, ou encore : si au moins une des comptes a mentionné l’autre dans un Tweet, il y a un lien entre ces deux comptes…

Construction du réseau
Analyse du réseau

Analyse du réseau

Enfin, une fois le réseau construit et représenté, il est possible d’effectuer une analyse de ce dernier, en se basant sur la Théorie des Réseaux. Différentes mesures permettent de mesurer plusieurs aspects du réseau : importance du réseau, homophilie, densité, interactions… Ces mesures permettent d’effectuer des comparaisons et d’en ressortir des conclusions. Cela permettra alors de réaliser des recommandations au client, en fonction de ses objectifs et de son activité.