Google Search Console : les regex les plus utiles pour l’analyse SEO

Google Search Console : les regex les plus utiles pour l'analyse SEO

Bonjour à tous les passionnés de SEO et d’analyse de données ! Maurice Dubreuil au rapport, prêt à vous embarquer dans une aventure au cœur de Google Search Console. Aujourd’hui, nous allons explorer un outil puissant mais souvent sous-estimé : les expressions régulières, ou regex pour les intimes. Alors, attachez vos ceintures, on décolle !

Pourquoi les regex sont vos meilleures alliées en SEO ?

Avant de plonger dans le vif du sujet, posons-nous la question : pourquoi diable devriez-vous vous intéresser aux regex dans Google Search Console (GSC) ? Eh bien, imaginez-vous en train de fouiller dans une montagne de données à la recherche d’informations précieuses. Les regex sont comme votre détecteur de métaux high-tech qui vous permet de dénicher rapidement les pépites d’or cachées dans ce tas de sable.

Les expressions régulières vous offrent une flexibilité incroyable pour filtrer et analyser vos données SEO. Elles vous permettent de :

  • Regrouper des pages similaires
  • Identifier des motifs dans les requêtes de recherche
  • Exclure certains types de contenu de vos analyses
  • Détecter des anomalies dans vos URLs
  • Bref, c’est comme avoir un couteau suisse pour votre analyse SEO. Alors, prêts à devenir des ninjas des regex ?

    Les regex de base pour débuter en beauté

    Commençons doucement avec quelques expressions régulières simples mais diablement efficaces :

    1. Le point (.) : le joker des regex

    Le point est comme le joker au poker. Il peut remplacer n’importe quel caractère. Par exemple, « s.o » matchera « seo », « smo », et même « s1o ». Pratique pour attraper les variations d’orthographe, non ?

    Regex : s.o

    2. L’astérisque (*) : le répétiteur infini

    L’astérisque permet de dire « le caractère précédent peut être répété zéro fois ou plus ». Par exemple, « seo* » matchera « se », « seo », « seooo », etc. C’est parfait pour capturer les pluriels ou les variations d’un mot.

    Regex : seo*

    3. Le plus (+) : au moins une fois

    Similaire à l’astérisque, mais le caractère précédent doit apparaître au moins une fois. « seo+ » matchera « seo », « seooo », mais pas « se ». Idéal pour s’assurer qu’un élément est présent.

    Regex : seo+

    4. Le point d’interrogation (?) : optionnel

    Le point d’interrogation rend le caractère précédent optionnel. « blogs? » matchera « blog » et « blogs ». Parfait pour les singuliers et pluriels en anglais !

    Regex : blogs?

    Les regex avancées pour impressionner vos collègues

    Maintenant que vous avez les bases, passons à la vitesse supérieure avec des regex plus complexes mais ô combien utiles !

    5. Les crochets [] : la liste de choix

    Les crochets permettent de définir une liste de caractères possibles. Par exemple, « [sS][eE][oO] » matchera « seo », « SEO », « SeO », etc. C’est l’arme ultime contre les variations de casse !

    Regex : [sS][eE][oO]

    6. Le circonflexe (^) : le début de ligne

    Le circonflexe au début d’une regex indique le début d’une ligne. « ^/blog/ » matchera toutes les URLs commençant par « /blog/ ». Parfait pour analyser une section spécifique de votre site.

    Regex : ^/blog/

    7. Le dollar ($) : la fin de ligne

    À l’inverse, le dollar à la fin d’une regex indique la fin d’une ligne. « .html$ » matchera toutes les URLs se terminant par « .html ». Idéal pour repérer les pages statiques !

    Regex : .html$

    8. Les parenthèses () : le groupement

    Les parenthèses permettent de grouper des éléments. « (seo|sem) » matchera « seo » ou « sem ». C’est parfait pour regrouper des termes similaires dans votre analyse.

    Regex : (seo|sem)

    Cas d’utilisation concrets dans Google Search Console

    Maintenant que nous avons nos outils, voyons comment les utiliser efficacement dans GSC :

    Analyser les performances par catégorie

    Supposons que vous ayez des URLs de type « /categorie/nom-article ». Pour analyser les performances de la catégorie « seo », vous pouvez utiliser :

    Regex : ^/seo/.*

    Cette expression matchera toutes les URLs commençant par « /seo/ » suivies de n’importe quoi.

    Exclure les pages de pagination

    Les pages de pagination peuvent fausser vos analyses. Pour les exclure, utilisez :

    Regex : ^(?!.*page=).*$

    Cette expression complexe matchera toutes les URLs ne contenant pas « page= ».

    Regrouper les variations de requêtes

    Pour regrouper toutes les variations autour du terme « seo », comme « seo tips », « seo tricks », etc., utilisez :

    Regex : seo.*

    Cette expression matchera tous les termes commençant par « seo ».

    Identifier les pages AMP

    Si vous utilisez AMP, vous pouvez identifier ces pages avec :

    Regex : /amp/

    Cette simple expression matchera toutes les URLs contenant « /amp/ ».

    Astuces pour maîtriser les regex dans GSC

    Voici quelques conseils pour devenir un véritable maître des regex dans Google Search Console :

  • Testez toujours vos regex avant de les utiliser. Un petit outil en ligne comme regex101.com peut vous sauver la mise.
  • Commencez simple et complexifiez progressivement. Rome ne s’est pas faite en un jour, votre maîtrise des regex non plus !
  • N’hésitez pas à combiner plusieurs regex pour des filtres ultra-précis.
  • Documentez vos regex. Croyez-moi, dans 6 mois, vous serez content d’avoir laissé des commentaires.
  • Partagez vos regex avec votre équipe. L’union fait la force, surtout en SEO !
  • Les expressions régulières dans Google Search Console sont comme un super-pouvoir pour les analystes SEO. Elles vous permettent de plonger profondément dans vos données, de découvrir des insights cachés et d’affiner votre stratégie SEO comme jamais auparavant.

    Alors, chers ninjas du SEO, êtes-vous prêts à révolutionner vos analyses avec ces regex surpuissantes ? N’hésitez pas à partager vos propres astuces regex dans les commentaires. Et rappelez-vous, dans le monde du SEO, la connaissance, c’est le pouvoir. Alors partagez, apprenez, et dominez les SERPs !

    Sur ce, je vous laisse vous amuser avec vos nouvelles armes d’analyse massive. Que la force des regex soit avec vous !