Aymeric Jacquet, Me, Myself and I…

Ils sont forts chez Pages Jaunes

Ce matin je remarque qu’un robot, que je ne connais pas, crawl mon blog (ce qui est étonnant c’est qu’il ne semble pas avoir crawlé le site AJcréa).

Identité du robot : FAST Enterprise Crawler 6 used by Pages Jaunes

A l’instant je suis contacté par téléphone par les Pages Jaunes pour connaître mes désirs en terme de publication sur leurs différents supports (le gars a eu de la chance j’ai eu le temps de me calmer).

Je ne sais pas quoi en penser, si ce n’est que je ne crois pas aux coïncidences.

Au passage, des conseils sur des formats d’encarts Pages Jaunes ou sur d’autres de leurs publications séraient les bienvenus, ainsi que tout retour d’experience.

novembre 23, 2006

Aymeric Jacquet

Entreprise

14 réponses à “Ils sont forts chez Pages Jaunes”

Silabi dit :

8 décembre 2006 à 19 h 32 min

IP:193.252.242.66
Addr:193.252.242.66
User Agent:FAST Enterprise Crawler 6 used by Pages Jaunes (crawladmin@gmail.com)

Moi aussi ! Je ne sais pas quoi penser aussi…A quoi va exactement servir ce crawl pour les Pages Jaunes ? Si quelqu’un à une réponse, je suis prenneur.
Aymeric Jacquet dit :

8 décembre 2006 à 20 h 51 min

Bonjour Silabi, ils sont repassés cette semaine effectivement.

J’ai posé la question au démarcheur des pages jaunes, il semblait ne rien savoir, ce qui n’est pas étonant, ce type de services sont souvent réalisés en soustraitance.

Il est possible également que les pages jaunes prevoient une rubrique blog, peut être même pour les pages blanches. Affaire à suivre en tous cas.
Silabi dit :

9 décembre 2006 à 2 h 24 min

En cherchant "pages jaunes crawl" sur google, j’ai découvert (http://www.webrankinfo.com/forum... car je ne savait pas encore, que pagesjaune.fr devenait un moteur de recherche…Mais la question reste : peuvent-ils crawler mon site, sans mon autorisations, pour l’indexer ?
Aymeric Jacquet dit :

9 décembre 2006 à 10 h 57 min

@sibali : en théorie oui, comme tout moteur de recherche, à moins que tu n’utilise des droits spécifiques d’accès dans ton robot.txt ou dans le header de tes pages, voir encore dans ton fichier .htacces si tu en as un.
Jlabfinance dit :

19 décembre 2006 à 23 h 48 min

Mon site a été crawlé par le même moteur mais pourqui pouquoi ????
silabi dit :

25 décembre 2006 à 15 h 03 min

Je suis crawlé régulièrement maintenant. Pourquoi me crawl t-on, dans quel but préci, et pourquoi mon site ? Autant de question auquels je cherche des réponces en vain…
Aymeric Jacquet dit :

26 décembre 2006 à 9 h 57 min

@silabi – Jlabfinance : si la pages jaunes préparent un moteur de recherche, leur robot ne fait que ce que tous les autres robots de moteurs de recherche font, il indexe du contenu. Maintenant, si vous ne désirez plus qu’il vous visite, je pense qu’il doit respecter les autorisations que l’on donne via robot.txt ou tout autre moyen de contrôle. Il suffit alors de lui interdire l’accès.
phantomoftheradio dit :

12 février 2007 à 18 h 27 min

Comment lui interdire l accès ?
merci :-)
Aymeric Jacquet dit :

13 février 2007 à 11 h 59 min

@phantomoftheradio : Plusieurs méthodes :

– Soit passer par le fichier robot.txt dans lequel vous ajoutez ces lignes :
User-agent: FAST Enterprise Crawler 6 used by Pages Jaunes (crawladmin@gmail.com)
Disallow:/

Quelques informations sur le robot.txt : http://www.abondance.com/docs/ro...

– Soit si vous avez la possibilité d’utiliser un fichier .htaccess vou ajoutez cette ligne :
order allow,deny
deny from 193.252.242.66
allow from all

193.252.242.66 est l’Ip du robot, mais il est possible qu’il en utilise d’autres.

Quelques informations sur le fichier .htaccess : http://www.commentcamarche.net/a...
bertelle nicolas dit :

5 mars 2007 à 17 h 48 min

Bonjour

Même remarque que les précédentes un robot « Fast 3, pages jaunes » crawle depuis le 03 mars chaque jour et dans des proportions importantes mon site.

Même question que posée précédemment, la checkbox autorisant le référencement du site elle est ou ?

Voilà ;-)
Aymeric Jacquet dit :

5 mars 2007 à 22 h 54 min

même peine, même punition Nicolas, si le robot des pages jaunes respecte les usages en matière de crawl, il devrait se plier aux directives du robot.txt.
elfredo dit :

9 juin 2007 à 18 h 54 min

je suis commercial aux pages jaunes depuis plus de 5 ans et je peux vous garantir que ce n’est pas du tout la procédure commerciale que pages jaunes utilise pour prospecter.D’autant plus que pages jaunes ne référence pas les blogs.Pour repondre à la personne qui voulait des infos sur les encarts,investit en priorité sur pages jaunes.fr et tu est garantit d’avoir un retour sur investissement.
Lano dit :

22 avril 2008 à 15 h 49 min

Peut être est ce pagesjaunes.com ??? Attention, c’est une escroquerie, pages jaunes (les vrais) à mis en procès cette société et à gagner .
Yoann dit :

5 août 2010 à 8 h 57 min

Bonjour,
Désolé, mais je vois pas du tout ou est le problème. Il existe des dizaines de robots qui viennent crawler nos sites tous les jours. Un robots de plus ou de moins, ca change quoi ?