|
| referencement
(12238) • 7dragons (12) • Abondance (546) • Adsense-fr (102) • Affordance (860) • Ajblog (10) • Arkantos (242) • Ask Blog (28) • Berszerkers (133) • Blog Abondance (260) • Bvwg (41) • Carnets-ref. (20) • Deepindex (21) • Dsi (166) • Enaty (431) • Exalead (55) • Fabriksite (10) • Franck Poisson (143) • Gnoztik (53) • Go-referencement (87) • Google (52) • Google News (699) • Google-stories (47) • Googlinside (107) • Indexweb (232) • Inferences (24) • Influx (174) • Kartoo (32) • Lereferencement (17) • Lienssponso. (283) • Linkagent (5) • Moteur (12) • Moteurs-news (126) • Moteurzine (281) • Motrech (71) • Msn (33) • Outil Ref. (239) • Outils Froids (374) • Prvweaver (16) • Rankingmetrics (7) • Recherche-univ. (18) • Recruteo (149) • S. Billard (286) • Seo-blackout (44) • Sumhit (29) • Synodiance (30) • Taggle (11) • Wayenborgh (9) • Webmarketer (322) • Webmaster-hub (1311) • Webrankinfo (418) • Wikio Seo (1982) • Yahoo Mdr (493) • Yooda (345) • Zorgloob (740)
|
Episode 4 : Sitemaps (based on a true story)24/08/2007 15:36résumé des épisodes précédents : bot dit le crawler récupère des pages sur le web en les suivant de lien en lien. il se démène ainsi de site en site en suivant les meilleurs liens. il essaie d'imiter son maître...
bot dit le crawler récupère des pages sur le web en les suivant de lien en lien. il se démène ainsi de site en site en suivant les meilleurs liens. il essaie d'imiter son maître le grand humphrey bogart qui lui, suit toujours la bonne piste. ce n’est pas le genre de type à se laisser embarquer n'importe où. mais bot est perfectionniste. il a le sentiment qu'il ne fait pas son travail à fond. quand il s'arrête de travailler sur un site qu'on lui a confié, il n’est jamais sûr d'avoir fait le tour du sujet et d'avoir récupéré l'ensemble des pages du site. pour régler tout cela, bot a une idée : il va demander à ted de tout lui raconter, tout ce qu'il sait sur lui, ainsi bot pourra mieux faire son job. la méthode est simple et sans bavure : cela consiste à mettre en place un fichier sur son site qui indique toutes les urls que son site contient ainsi que des meta-données sur ces urls comme leur fréquence de changement, etc. ce fichier est en xml et ressemble à cela : <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> essentiellement, une grande liste d'urls. pour indiquer à bot où ce fichier se trouve, ted va aussi rajouter dans son fichier robots.txt, la ligne suivante : sitemap: http://www.example.com/sitemap.xml mais bot sait que tous ses clients ne sont pas aussi clean que ted. il sait qu'il y en a des véreux, des qui vous emmènent sur une fausse piste pour vous détourner de la défense de la veuve et de l'orphelin. bot est un gars sympa mais faut pas lui raconter de crasses. quand on lui file une liste d'urls, il la vérifie. et si on essaye de lui refourguer des trucs en double, des trucs qui n’ont rien à voir avec la semoule, eh bien, il dit "stop bot" et passe à une autre affaire. sitemaps est un protocole historiquement proposé par google, puis discuté par msn, yahoo et ask. il est aujourd'hui devenu un standard qui est implémenté par google, yahoo, ask et maintenant exalead depuis juillet 2007. plus d'informations sur http://www.sitemaps.org/fr/ sébastien Source : Exalead ![]() Autres actualités de cette journée : 24/08/2007
|
|
© 2006 - 2008 par IDF.net - partenaires : MoteurZine SEOgame |