Aller un peu plus loin – Analyse des facteurs de classement pour Baidu, le plus grand moteur de recherche chinois


De nombreuses études de corrélation des facteurs de classement de Google ont été publiées dans le passé – par nous ainsi que par d'autres organisations et individus – mais, jusqu'à présent, personne n'avait entrepris une analyse systématique des facteurs de classement organiques de Baidu.

En ce qui concerne Baidu, de nombreux référenceurs pensent au référencement en termes de ce qui fonctionne dans Google.

Bien que ce ne soit pas dans l'ensemble une mauvaise ou une mauvaise approche, le fait est que cela laisse des trous béants dans leurs méthodes – il y a des choses qui ne ressemblent en rien du tout à Google, et c'est la chose intéressante à propos de cette étude que j'ai réalisée et nous vous proposons de télécharger gratuitement.

La méthode

À la mi-2020, j'ai analysé les URL et les extraits indexés des 10 meilleures pages de classement dans les résultats de recherche organique Baidu pour environ 50000 termes de recherche chinois.

Les règles de sélection des termes de recherche étaient les suivantes:

  • 100% chinois (pas de chiffres, pas de lettres latines, pas d'arabe, de japonais ou d'autres langues)
  • 100% chinois simplifié (pas de caractères longs aussi communs aux langues chinoises de Taiwan ou de Hong Kong)
  • Les mots clés comprenaient entre 2 et 8 caractères.

Qui croire?

Les experts en référencement de Baidu professent de nombreuses opinions contradictoires, ce qui rend difficile pour les référenceurs de savoir qui croire. Un exemple est sur le thème des domaines de premier niveau de code de pays (ccTLD).

Par exemple, Veronique Duong, Expert SEO chez Fabernovel et auteur de Baidu SEO publié par ISTE Ltd.) dit qu'il y a un avantage à avoir un ccTLD quand on tente de bien se classer dans Baidu.

Gary Stevens, développeur front-end et auteur du guide SEMRush Baidu SEO, soutient qui croit, "Obtenez un .cn ou ne vous inquiétez pas. Baidu préfère fortement le suffixe de domaine .cn (code du pays de la Chine) à .com dans le classement de ses résultats de recherche. "

Dragon Metrics déclare qu'un ccTLD chinois n'est probablement pas un facteur de classement – je peux valider qu'ils sont effectivement corrects! En 2017, j'ai clairement réfuté ce mythe et mon analyse détaillée du classement Baidu cette année l'a encore confirmé.

Avoir un domaine .com.cn ou .cn ne garantit aucun avantage de classement.

FR Blog Baidu Image 1

Graphique: répartition des TLD dans le Top 10 Baidu (hors propriétés appartenant à Baidu)

Il est clair que le générique .com TLD est de loin l'extension de domaine la plus dominante dans les SERP Baidu (sans compter les propriétés appartenant à Baidu, qui représentent environ 50% du Top 10. Téléchargez l'étude pour plus d'informations sur la domination de Baidu).

Avoir un ccTLD n'est cependant pas un inconvénient: 9% des TLD du Top 10 Baidu (hors sites Web appartenant à Baidu) sont des ccTLD chinois tels que .cn, .com.cn, org.cn et .net.cn.

Je ne dis pas qu’il existe des signaux de classement clairs liés aux TLD, les données ne l’indiquent tout simplement pas.

Un autre mythe brisé – HTTP vs HTTPS

De nombreux blogueurs Baidu SEO ont sauté à la conclusion que la configuration de votre site Web en https est un facteur de classement après que Baidu a annoncé qu'il l'utiliserait comme signal.

L'étude a révélé que plus de 50% des résultats de recherche dans le Top 10 sont des URL https… Mais il n'y avait pas de corrélation claire avec le fait qu'il s'agit certainement d'un facteur de classement. Si 50% du classement des URL n'utilisent pas https, il est clair que ce n'est pas un facteur décisif pour les référenceurs s'ils ne sont pas passés à https.

Bien sûr, je conseillerais à tout propriétaire de site Web qui souhaite réussir en Chine de chiffrer son site Web. Non seulement parce que c'est logique, mais parce que cela pourrait bien être un facteur de classement, le temps nous le dira. Cependant, la chose clé à noter est que vous ne devez pas vous attendre à un gros avantage de classement.

FR Blog Baidu Image 2

Graphique: Pourcentage d'URL https par position de classement de la page 1 (1 à 10)

Utilisation du sous-domaine, une surprise

Je continue d’être convaincu qu’il est avantageux pour le SEO pour Baidu de distribuer des intentions d’utilisateur fondamentalement différentes sur différents sous-domaines.

J'ai été surpris de ce que j'ai découvert sur l'utilisation des sous-domaines dans les résultats.

Les grands acteurs chinois montrent la voie en matière de sous-domaines. Bon nombre des plus grandes marques chinoises hébergent leurs activités principales sur le www sous-domaine, mais leurs différentes sections de site – Assistance clientèle, FAQ, forums d'utilisateurs, forums d'aide, galeries d'images, portails vidéo, wikis, etc. – sont chacune hébergées sur des sous-domaines uniques et individuels.

Mais, il y a une indication claire que les 10 pages les mieux classées sont hébergées sur le sous-domaine www.

Même si cette corrélation pourrait ressembler à un facteur de classement, ma conviction basée sur les données est que ce n'est qu'une corrélation et non un facteur de classement définitif. Le fait que de nombreuses entreprises publient leur cœur de métier respectif sur le domaine www m'amène à cette conclusion.

FR Baidu BLog Image 3

Graphique: Pourcentage de www. Sous-domaines par page 1 Position de classement (1 à 10)

Étant donné que Baidu préfère une orientation utilisateur claire par site Web et par sous-domaine, mon conseil est le suivant: si un domaine indépendant est choisi pour le marché chinois, le cœur de métier doit être placé sur le sous-domaine www (par exemple www.mychinesedomain.com), tout en L'intention de l'utilisateur (blog, forum, questions-réponses, etc.) doit être prise en compte et hébergée sur différents sous-domaines.

Si, d'un autre côté, une stratégie de sous-domaine pour l'internationalisation est déjà utilisée, telle que cn.mydomain.com, j'architecte le site Web pour diviser l'intention de l'utilisateur de cette manière cn.mydomain.com/forum/, car c'est le meilleure façon suivante pour obtenir une séparation structurelle claire du sous-domaine.

Mais cela commence à devenir un peu philosophique et je suis sûr que d'autres personnes verraient les choses différemment, faites-moi savoir ce que vous en pensez dans les commentaires ci-dessous.

Quelques aperçus (sans surprise) du contenu du site Web

Ce ne sera pas une surprise pour les sinophiles et tous ceux qui prêtent une attention particulière au paysage numérique en Chine que plus de 98% des pages de premier rang utilisent des caractères chinois simplifiés.

Les caractères chinois traditionnels sont principalement utilisés à Hong Kong et à Taiwan et, comme le montrent les données, l'utilisation d'un trop grand nombre de caractères chinois traditionnels réduit probablement vos chances de succès dans les résultats de recherche Baidu.

Pour aller un peu plus loin, le contenu de la page, en général, est composé de 57% de caractères chinois (les 43% restants sont composés de lettres latines, de chiffres, de signes de ponctuation et d'espaces) et se classe pour les termes de recherche composés à 100% de caractères chinois. .

FR Blog Baidu Umage 4

Graphique: pourcentage de caractères chinois dans le contenu total de la page en moyenne par Page 1 Position de classement (1 à 10)

FR Blog Baidu Image 5

Graphique: Pourcentage de caractères chinois simplifiés dans la page 1 Position de classement (1 à 10)

Non seulement les symboles illustrés de caractères chinois, mais le contenu des sites Web chinois les mieux classés est également plein d'images qui semblent corréler à un meilleur classement. Téléchargez l'étude de corrélation des facteurs de classement de Baidu pour en savoir plus sur les images en tant que corrélation de classement.

Balises de titre et descriptions

Beaucoup d'entre vous qui travaillent dans le référencement attendaient une réponse à cela! Enfin, le voici:

Le titre de l'extrait de code Baidu SERP comprend jusqu'à 32 caractères et la méta-description dans l'extrait de code jusqu'à 75 caractères.

Explication des extraits d'index

Dans cette image, les caractères chinois sont représentés par les petits carrés.

FR Blog Baidu Image 6

Le titre affiché dans le SERP est limité à 32 caractères. Cependant, la plupart des sites Web ont une longueur moyenne de 22 à 23 caractères (représentés par les carrés bleus) et n'utilisent donc pas les 32 caractères disponibles (les espaces restants sont les carrés gris).

La méta description contient jusqu'à 75 caractères dans l'extrait SERP (carrés gris foncé), alors que la méta description utilisée dans le code source est, en moyenne, beaucoup plus longue (représentée par les carrés rouges dans l'image ci-dessus).

Garder le titre plus court que l'espace réel disponible mais avoir des méta descriptions qui sont environ 23 caractères plus longs que ce que l'extrait de code rend visible semble être une pratique courante selon les données analysées.

Pour les 10 pages les mieux classées, 22,55 caractères correspondent à la longueur moyenne de la balise de titre et 98,18 caractères à la longueur moyenne de la méta-description.

Une invitation à télécharger l'étude, sur nous

L'étude complète, qui est actuellement téléchargeable gratuitement (nos compléments), fournit beaucoup plus d'informations qui non seulement révèlent des informations intéressantes, mais vous donnent également la confiance nécessaire pour commencer à mettre en œuvre des modifications sur votre site Web pour améliorer vos résultats dans Baidu.

Quelques découvertes plus intéressantes que vous pouvez découvrir: