Ils sont forts chez Pages Jaunes


Ce matin je remarque qu’un robot, que je ne connais pas, crawl mon blog (ce qui est étonnant c’est qu’il ne semble pas avoir crawlé le site AJcréa).

Identité du robot : FAST Enterprise Crawler 6 used by Pages Jaunes

A l’instant je suis contacté par téléphone par les Pages Jaunes pour connaître mes désirs en terme de publication sur leurs différents supports (le gars a eu de la chance j’ai eu le temps de me calmer).

Je ne sais pas quoi en penser, si ce n’est que je ne crois pas aux coïncidences.

Au passage, des conseils sur des formats d’encarts Pages Jaunes ou sur d’autres de leurs publications séraient les bienvenus, ainsi que tout retour d’experience.


14 réponses à “Ils sont forts chez Pages Jaunes”

  1. IP:193.252.242.66
    Addr:193.252.242.66
    User Agent:FAST Enterprise Crawler 6 used by Pages Jaunes (crawladmin@gmail.com)

    Moi aussi ! Je ne sais pas quoi penser aussi…A quoi va exactement servir ce crawl pour les Pages Jaunes ? Si quelqu’un à une réponse, je suis prenneur.

  2. Bonjour Silabi, ils sont repassés cette semaine effectivement.

    J’ai posé la question au démarcheur des pages jaunes, il semblait ne rien savoir, ce qui n’est pas étonant, ce type de services sont souvent réalisés en soustraitance.

    Il est possible également que les pages jaunes prevoient une rubrique blog, peut être même pour les pages blanches. Affaire à suivre en tous cas.

  3. @sibali : en théorie oui, comme tout moteur de recherche, à moins que tu n’utilise des droits spécifiques d’accès dans ton robot.txt ou dans le header de tes pages, voir encore dans ton fichier .htacces si tu en as un.

  4. Je suis crawlé régulièrement maintenant. Pourquoi me crawl t-on, dans quel but préci, et pourquoi mon site ? Autant de question auquels je cherche des réponces en vain…

  5. @silabi – Jlabfinance : si la pages jaunes préparent un moteur de recherche, leur robot ne fait que ce que tous les autres robots de moteurs de recherche font, il indexe du contenu. Maintenant, si vous ne désirez plus qu’il vous visite, je pense qu’il doit respecter les autorisations que l’on donne via robot.txt ou tout autre moyen de contrôle. Il suffit alors de lui interdire l’accès.

  6. @phantomoftheradio : Plusieurs méthodes :

    – Soit passer par le fichier robot.txt dans lequel vous ajoutez ces lignes :
    User-agent: FAST Enterprise Crawler 6 used by Pages Jaunes (crawladmin@gmail.com)
    Disallow:/

    Quelques informations sur le robot.txt : http://www.abondance.com/docs/ro...

    – Soit si vous avez la possibilité d’utiliser un fichier .htaccess vou ajoutez cette ligne :
    order allow,deny
    deny from 193.252.242.66
    allow from all

    193.252.242.66 est l’Ip du robot, mais il est possible qu’il en utilise d’autres.

    Quelques informations sur le fichier .htaccess : http://www.commentcamarche.net/a...

  7. Bonjour

    Même remarque que les précédentes un robot « Fast 3, pages jaunes » crawle depuis le 03 mars chaque jour et dans des proportions importantes mon site.

    Même question que posée précédemment, la checkbox autorisant le référencement du site elle est ou ?

    Voilà ;-)

  8. même peine, même punition Nicolas, si le robot des pages jaunes respecte les usages en matière de crawl, il devrait se plier aux directives du robot.txt.

  9. je suis commercial aux pages jaunes depuis plus de 5 ans et je peux vous garantir que ce n’est pas du tout la procédure commerciale que pages jaunes utilise pour prospecter.D’autant plus que pages jaunes ne référence pas les blogs.Pour repondre à la personne qui voulait des infos sur les encarts,investit en priorité sur pages jaunes.fr et tu est garantit d’avoir un retour sur investissement.

  10. Peut être est ce pagesjaunes.com ??? Attention, c’est une escroquerie, pages jaunes (les vrais) à mis en procès cette société et à gagner .

  11. Bonjour,
    Désolé, mais je vois pas du tout ou est le problème. Il existe des dizaines de robots qui viennent crawler nos sites tous les jours. Un robots de plus ou de moins, ca change quoi ?