Ils sont forts chez Pages Jaunes

Ce matin je remarque qu’un robot, que je ne connais pas, crawl mon blog (ce qui est étonnant c’est qu’il ne semble pas avoir crawlé le site AJcréa).

Identité du robot : FAST Enterprise Crawler 6 used by Pages Jaunes

A l’instant je suis contacté par téléphone par les Pages Jaunes pour connaître mes désirs en terme de publication sur leurs différents supports (le gars a eu de la chance j’ai eu le temps de me calmer).

Je ne sais pas quoi en penser, si ce n’est que je ne crois pas aux coïncidences.

Au passage, des conseils sur des formats d’encarts Pages Jaunes ou sur d’autres de leurs publications séraient les bienvenus, ainsi que tout retour d’experience.

Cordialement,
Aymeric Jacquet

Be Sociable, Share!

Articles similaires

    None Found

14 Commentaires pour Ils sont forts chez Pages Jaunes

  • IP:193.252.242.66
    Addr:193.252.242.66
    User Agent:FAST Enterprise Crawler 6 used by Pages Jaunes (crawladmin@gmail.com)

    Moi aussi ! Je ne sais pas quoi penser aussi…A quoi va exactement servir ce crawl pour les Pages Jaunes ? Si quelqu’un à une réponse, je suis prenneur.

    Le 8 décembre 2006 à 19 h 32 min

  • Aymeric Jacquet

    Bonjour Silabi, ils sont repassés cette semaine effectivement.

    J’ai posé la question au démarcheur des pages jaunes, il semblait ne rien savoir, ce qui n’est pas étonant, ce type de services sont souvent réalisés en soustraitance.

    Il est possible également que les pages jaunes prevoient une rubrique blog, peut être même pour les pages blanches. Affaire à suivre en tous cas.

    Le 8 décembre 2006 à 20 h 51 min

  • En cherchant "pages jaunes crawl" sur google, j’ai découvert (http://www.webrankinfo.com/forum... car je ne savait pas encore, que pagesjaune.fr devenait un moteur de recherche…Mais la question reste : peuvent-ils crawler mon site, sans mon autorisations, pour l’indexer ?

    Le 9 décembre 2006 à 2 h 24 min

  • Aymeric Jacquet

    @sibali : en théorie oui, comme tout moteur de recherche, à moins que tu n’utilise des droits spécifiques d’accès dans ton robot.txt ou dans le header de tes pages, voir encore dans ton fichier .htacces si tu en as un.

    Le 9 décembre 2006 à 10 h 57 min

  • Jlabfinance

    Mon site a été crawlé par le même moteur mais pourqui pouquoi ????

    Le 19 décembre 2006 à 23 h 48 min

  • Je suis crawlé régulièrement maintenant. Pourquoi me crawl t-on, dans quel but préci, et pourquoi mon site ? Autant de question auquels je cherche des réponces en vain…

    Le 25 décembre 2006 à 15 h 03 min

  • Aymeric Jacquet

    @silabi – Jlabfinance : si la pages jaunes préparent un moteur de recherche, leur robot ne fait que ce que tous les autres robots de moteurs de recherche font, il indexe du contenu. Maintenant, si vous ne désirez plus qu’il vous visite, je pense qu’il doit respecter les autorisations que l’on donne via robot.txt ou tout autre moyen de contrôle. Il suffit alors de lui interdire l’accès.

    Le 26 décembre 2006 à 9 h 57 min

  • Comment lui interdire l accès ?
    merci :-)

    Le 12 février 2007 à 18 h 27 min

  • @phantomoftheradio : Plusieurs méthodes :

    – Soit passer par le fichier robot.txt dans lequel vous ajoutez ces lignes :
    User-agent: FAST Enterprise Crawler 6 used by Pages Jaunes (crawladmin@gmail.com)
    Disallow:/

    Quelques informations sur le robot.txt : http://www.abondance.com/docs/ro...

    – Soit si vous avez la possibilité d’utiliser un fichier .htaccess vou ajoutez cette ligne :
    order allow,deny
    deny from 193.252.242.66
    allow from all

    193.252.242.66 est l’Ip du robot, mais il est possible qu’il en utilise d’autres.

    Quelques informations sur le fichier .htaccess : http://www.commentcamarche.net/a...

    Le 13 février 2007 à 11 h 59 min

  • Bonjour

    Même remarque que les précédentes un robot « Fast 3, pages jaunes » crawle depuis le 03 mars chaque jour et dans des proportions importantes mon site.

    Même question que posée précédemment, la checkbox autorisant le référencement du site elle est ou ?

    Voilà ;-)

    Le 5 mars 2007 à 17 h 48 min

  • même peine, même punition Nicolas, si le robot des pages jaunes respecte les usages en matière de crawl, il devrait se plier aux directives du robot.txt.

    Le 5 mars 2007 à 22 h 54 min

  • elfredo

    je suis commercial aux pages jaunes depuis plus de 5 ans et je peux vous garantir que ce n’est pas du tout la procédure commerciale que pages jaunes utilise pour prospecter.D’autant plus que pages jaunes ne référence pas les blogs.Pour repondre à la personne qui voulait des infos sur les encarts,investit en priorité sur pages jaunes.fr et tu est garantit d’avoir un retour sur investissement.

    Le 9 juin 2007 à 18 h 54 min

  • Lano

    Peut être est ce pagesjaunes.com ??? Attention, c’est une escroquerie, pages jaunes (les vrais) à mis en procès cette société et à gagner .

    Le 22 avril 2008 à 15 h 49 min

  • Bonjour,
    Désolé, mais je vois pas du tout ou est le problème. Il existe des dizaines de robots qui viennent crawler nos sites tous les jours. Un robots de plus ou de moins, ca change quoi ?

    Le 5 août 2010 à 8 h 57 min