Définition
YandexBot est le robot d’exploration officiel de Yandex, le principal moteur de recherche en Russie avec plus de 60% de parts de marché local. Ce crawler analyse et indexe les pages web pour alimenter les résultats de recherche de Yandex, particulièrement important pour les sites ciblant le marché russophone.
Identification YandexBot
User-Agent strings
# YandexBot standard
Mozilla/5.0 (compatible; YandexBot/3.0;
+http://yandex.com/bots)
# YandexBot mobile
Mozilla/5.0 (iPhone; CPU iPhone OS 8_1 like Mac OS X)
AppleWebKit/600.1.4 (KHTML, like Gecko) Version/8.0
Mobile/12B411 Safari/600.1.4 (compatible; YandexBot/3.0;
+http://yandex.com/bots)
# YandexBot images
Mozilla/5.0 (compatible; YandexImages/3.0;
+http://yandex.com/bots)
Variantes spécialisées
Types YandexBot :
├── YandexBot : Crawl général
├── YandexImages : Images
├── YandexVideo : Contenu vidéo
├── YandexNews : Actualités
├── YandexBlogs : Blogs et forums
└── YandexFavicons : Favicons
Spécificités techniques
Comportement de crawl
Caractéristiques YandexBot :
├── Respect robots.txt strict
├── Crawl-delay important (10s défaut)
├── JavaScript limité
├── Géolocalisation prioritaire
└── Contenu cyrillique favorisé
Indexation prioritaire
- Domaines .ru : Priorité maximale
- Contenu russe : Langue native
- Servers russes : Proximité géographique
- Sites populaires : Yandex.Metrica data
Configuration optimale
Robots.txt pour Yandex
# Configuration spécifique Yandex
User-agent: YandexBot
Crawl-delay: 2
Allow: /
Disallow: /search
Disallow: /admin
# Clean-param pour URLs dynamiques
Clean-param: utm_source&utm_medium&utm_campaign
# Host directive (important pour Yandex)
Host: https://example.com
Sitemap: https://example.com/sitemap.xml
Headers recommandés
# Géolocalisation
X-Robots-Tag: noyaca
Content-Language: ru
# Cache pour Yandex
Cache-Control: public, max-age=86400
Optimisation pour Yandex
Facteurs de ranking Yandex
Critères spécifiques :
├── Géolocalisation : IP, serveur, domaine
├── Comportement utilisateur : CTR, temps
├── Liens internes : Structure claire
├── Vitesse mobile : Priorité mobile-first
├── HTTPS : Facteur confirmé
└── Microdata : Support Schema.org
Yandex.Webmaster
Configuration essentielle :
├── Vérification site
├── Région principale
├── Adresse physique
├── Reindexation rapide
└── Monitoring erreurs
Marché et audience
Couverture géographique
Présence Yandex dominante :
├── Russie : 60%+ parts
├── Belarus : 25%
├── Kazakhstan : 40%
├── Ukraine : Variable
└── Pays baltes : <5%
Adaptation locale
<!-- Optimisation multi-régionale -->
<html lang="ru">
<head>
<meta charset="UTF-8">
<link rel="alternate" hreflang="ru" href="/ru/">
<link rel="alternate" hreflang="en" href="/en/">
<!-- Yandex.Metrica -->
<script type="text/javascript">
(function(m,e,t,r,i,k,a){...});
</script>
</head>
Outils Yandex
Yandex.Webmaster
- Site verification : Validation propriété
- Indexing : Status pages indexées
- Query analytics : Mots-clés Yandex
- Site quality : Score qualité
Yandex.Metrica
// Analytics russe
(function(m,e,t,r,i,k,a){
m[i]=m[i]||function(){(m[i].a=m[i].a||[]).push(arguments)};
m[i].l=1*new Date();k=e.createElement(t),a=e.getElementsByTagName(t)[0],
k.async=1,k.src=r,a.parentNode.insertBefore(k,a)})
(window, document, "script", "https://mc.yandex.ru/metrika/tag.js", "ym");
ym(12345678, "init", {
clickmap:true,
trackLinks:true,
accurateTrackBounce:true
});
Monitoring YandexBot
Logs analysis
# Extraire crawls YandexBot
grep -i "yandexbot" /var/log/nginx/access.log |
awk '{print $1, $4, $7, $9}' | head -20
# Fréquence par jour
grep -i "yandexbot" access.log |
awk '{print substr($4,2,11)}' |
sort | uniq -c
Performance metrics
KPIs YandexBot :
├── Pages crawlées/jour
├── Temps réponse moyen
├── Erreurs HTTP
├── Profondeur exploration
└── Fréquence retour
Différences avec Google
Algorithme distinct
Yandex vs Google :
├── Links : Moins de poids
├── Content : Plus important
├── User signals : CTR crucial
├── Geography : Facteur majeur
├── Language : Russe natif
└── Social : Facteur plus fort
Approche technique
- JavaScript : Support basique
- Mobile : Index mobile séparé
- Speed : Moins critique que Google
- Security : HTTPS bonus modéré
Pour les sites visant les marchés russophones, optimiser pour YandexBot peut significativement améliorer la visibilité sur ce moteur de recherche dominant régionalement.