Accueil Forum Actualité Tech et SEO, tutoriels et astuces Comment fonctionne l'algorithme de Google Actualités ?

Ce sujet a 0 réponse, 1 participant et a été mis à jour par  Houssen Moshinaly, il y a 1 mois et 4 semaines.

Affichage de 1 message (sur 1 au total)
  • Auteur
    Messages
  • #4462

    Houssen Moshinaly
    Admin bbPress

    Google Actualités est une source importante du trafic pour les sites qui ont le privilège d’y être inscrits. Malheureusement, Google Actualités est devenu une vraie usine de Spam ces derniers temps et on peut comprendre ce spam en détaillant les critères qui sont utilisés par l’algorithme de Google Actualités. Cet article se base sur une interview de Josh Cohen datant de 2009. À cette époque, il était le chef de produit chez Google Actualités. Et malgré le fait que Google News ait beaucoup changé au fil du temps, on peut apprendre beaucoup de choses sur les bases de l’algorithme de Google Actualités.

    Comment fonctionnent les Clusters de Google Actualités ?

    Quand vous allez dans Google Actualités, vous allez des voir Clusters d’articles sur un sujet donné. Par exemple, voici un Cluster d’articles dans la section Science/Tech de Google Actualités France.

    On décrit le fonctionnement de l'algorithme de Google Actualités. Les critères de classement et le spam par les médias de masse.

    Ce Cluster montre des articles sur un composant dans le Galaxy S8. Selon Cohen, l’algorithme va créer un Cluster du moment qu’il y a suffisamment d’articles qui parlent du sujet. Les Clusters apparaissent dans chaque section, mais ils apparaissent également selon les requêtes des visiteurs.

    On décrit le fonctionnement de l'algorithme de Google Actualités. Les critères de classement et le spam par les médias de masse.

    La position des Clusters se base sur le nombre d’articles sur le sujet, mais également sur les médias qui en parlent. Si vous avez les plus gros médias qui vont parler du prochain téléphone d’Apple, alors sa position dans le Cluster sera plus élevée que le reste.

    Les critiques sur la création des Clusters dans Google Actualités

    On voit tout de suite le problème avec cet algorithme de Google Actualités. On a mentionné que Google Actualités crée les Clusters quand les médias se donnent la peine de parler d’un sujet et c’est de cette manière que Google Actualités estime que le sujet vaut la peine d’être médiatisé. Si vous êtes un petit média et que vous avez accès à des contenus plus intéressants, plus spécialisés et exclusifs, alors vous pouvez aller vous faire foutre. Si ce n’est pas pertinent pour les médias de masse, alors Google Actualités ne l’affichera jamais. De ce fait, on est très loin de la pluralité promise par Google Actualités.

    De plus, Google Actualités va donner sa préférence aux gros médias puisqu’il estime qu’ils sont plus professionnels (lol). De ce fait, même si votre site publie un article méritant la une de Google Actualités, vous ne serez jamais visible, mais si le gros média pompe votre contenu, alors c’est lui qui sera affiché, car Google Actualités accorde une place centrale aux médias plus qu’aux contenus.

    Ce type d’approche crée un effet très pervers. L’actualité ne reflète plus les médias, mais ce sont les médias qui la fabriquent. Ce sont eux qui disent ce qui est important ou non et Google Actualités exacerbe ce décalage avec la réalité. Pas étonnant ensuite qu’on critique les médias pour être totalement déconnectés de la réalité.

    Les critères de classement de Google Actualités : La fraicheur et la localisation de la source

    Mais la question la plus importante est comment un article se positionne en première place dans Google Actualités. Cohen répond qu’il a plusieurs facteurs, mais les plus importants sont l’originalité du contenu, le Timing de la publication, la localisation de la source et le nombre de clics. Sur l’originalité du contenu, on repassera puisque ce critère est négligé par rapport à la création des clusters. Même si votre contenu est entièrement original, mais que les médias de masse s’en foutent, alors vous n’avez aucune chance. La localisation de la source indique que plus un média est proche géographiquement de l’événement qu’il couvre et plus il aura des chances d’être visible. Là encore, on doute de cette affirmation, car notre site propose souvent des actualités de Madagascar et nous devrions être privilégiés pour les actualités malgaches puisque nous sommes basés dans ce pays, mais à la place, on voit des articles de RFI, de l’Express et du Figaro…

    De plus, Google Actualités équilibre entre le contenu le plus récent et le plus original. Si vous venez juste de publier votre article, mais qu’il n’apporte aucune valeur ajoutée ou que vous l’avez repompé d’un autre site (genre l’AFP), alors Google Actualités va privilégier le contenu original… sur le papier. Dans la réalité, près de 87 % des articles de Google Actualités sont des dépêches copiées collées de l’AFP ou d’autres agences.

    Pas de NewsRank ou de SourceRank, mais des classements pour chaque site

    Contrairement à Google Recherche, Google Actualités n’utilise pas un PageRank global. À la place, il utilise des critères de classement pour chaque site. Il va regarder le nombre d’articles dans une catégorie donnée et il va se dire que c’est une source pertinence (vous la voyez venir, la grosse arnaque). Par exemple, si Reuters ou Le Monde ont des milliers d’articles dans la catégorie Politique ou Économie, alors Google Actualités considère que ce sont les meilleures sources dans ces domaines.

    Mais c’est du Bullshit, car si Google Actualités regarde seulement le nombre d’articles sur une catégorie donnée, alors il est très facile de l’abuser en publiant automatiquement le contenu des autres. Et c’est ce qui se passe depuis plusieurs mois avec plusieurs sites inscrits dans Google Actualités. Et avec une publication automatique, vous pouvez avoir des milliers d’articles en quelques semaines. Et donc, pour Google Actualités, c’est un critère de classement. Évidemment, votre site sera pénalisé sur le long terme, mais c’est suffisant pour se classer sur le moyen terme.

    Google Actualités accorde de l’importance aux clics

    Les clics sont un critère de classement dans Google Actualités. Si votre site propose du contenu original et que BFMTV pique votre contenu en le republiant sous son nom, il va décrocher la une. Pourquoi ? Parce que BMFTV va évidemment attirer plus de clics grâce à sa base quotidienne de visiteurs. C’est pourquoi vous n’arriverez jamais à rivaliser avec les gros sites même s’ils font uniquement du spam. Google Actualités va regarder le nombre de clics, mais également l’interaction sur les réseaux sociaux et la branlette de copinage. C’est moi qui ai inventé ce terme. La branlette de copinage consiste pour les médias de masse à se faire des liens et c’est pourquoi certains articles ont la mention Cité à de nombreuses reprises.

    Et comme les médias se remercient mutuellement dans une branlette perpétuelle, il est normal qu’ils dominent dans Google Actualités. Notons que ces critères de classement de Google Actualités sont confirmés par un brevet de Google déposé en 2003. Cela inclut le nombre d’articles publiés par le média (donc potentiellement du spam), la longueur moyenne d’article et l’importance de la couverture de la source. Cela signifie que si vous parlez régulièrement d’un sujet, alors vous vous classerez mieux dans cette catégorie. Mais comme on l’a mentionné, les médias de masse sont chouchoutés par Google Actualités et ils n’ont aucune pénalisation pour plagiat et autre, et donc, même si vous vous spécialisez à mort, alors vous serez toujours secondaire pour Google Actualités. Il y a d’autres facteurs tels que le nombre de rédacteurs travaillant pour le média, le style d’écriture et l’opinion humaine sur l’article et les statistiques. Mais on se rend compte qu’on peut booster artificiellement ces critères avec un peu de créativité et d’automatisation.

    Je mettrais à jour cet article en fonction de mes découvertes.

Affichage de 1 message (sur 1 au total)

Vous devez être connecté pour répondre à ce sujet.

Aller à la barre d’outils