ROSE Posted May 2, 2009 Share Posted May 2, 2009 Bonjour,Je vois sur Outils Google pour Webmasters que google m'affiche 105 erreurs en "URL à accès restreint par un fichier robots.txt"Il s'agit des URLS de paniers : http://www.monsite.com/cart.php?add&id_product=112&token=149ff704407f522e3dcb07013d380ccbetc.... Dans mon robots.txt , j'ai : ...... Disallow: /cart.php ...... Donc est-ce normal que Google me les sortent en erreur, même si il indique : Google n'a pas pu explorer l'URL en raison d'une restriction dans le fichier robots.txt. Ce problème peut avoir plusieurs causes. Par exemple, votre fichier robots.txt peut interdire totalement l'accès de Googlebot à votre site ; il peut interdire l'accès au répertoire dans lequel se trouve cette URL ou interdire l'accès à cette URL en particulier. Bien souvent, il ne s'agit pas d'une erreur. et À quoi les erreurs liées aux URL restreintes par un fichier robots.txt correspondent-elles ?ImprimerGoogle n'a pas pu explorer l'URL en raison d'une restriction dans le fichier robots.txt. Ce problème peut avoir plusieurs causes. Par exemple, votre fichier robots.txt peut interdire totalement l'accès de Googlebot à votre site ; il peut interdire l'accès au répertoire dans lequel se trouve cette URL ou interdire l'accès à cette URL en particulier. Bien souvent, il ne s'agit pas d'une erreur. Vous pouvez avoir configuré le fichier robots.txt de manière à nous empêcher d'explorer cette URL. Dans ce cas, il n'y a pas lieu d'intervenir. Nous continuerons de respecter les paramètres du fichier robots.txt pour ce fichier.Lorsqu'une URL comporte une redirection vers une URL bloquée par un fichier robots.txt, la première URL est également signalée comme bloquée par ce fichier et cela, même si l'outil d'analyse la considère comme Autorisé. Merci de vos conseils Rose Link to comment Share on other sites More sharing options...
JBENs Posted August 27, 2009 Share Posted August 27, 2009 Bonjour,N'ayant pas de réponses sur ce sujet je me permets de relancer ce topic.Lorsque je suis dans l'outils pour les webmasters de Google et que je suis dans Diagnostic/Erreurs d'exploration, j'ai dans "Accès restreint par un fichier robots.txt" plus de 3000 URLs inscrites de ce type:http://www.monsite.fr/cart.php?add&id_product=10&token=0ab99451fd280af4403b8b7dc0df3da9Pourtant dans le fichier robots.txt, il y a bien indiqué: Disallow: /cart.php et dans le sitemap cette page n'est pas visible...Pourriez-vous me dire à quoi cela est du?Merci Link to comment Share on other sites More sharing options...
Gregory Roussac Posted August 27, 2009 Share Posted August 27, 2009 A ne pas les indexer justement. Vous cherchez ou il n'y a pas d'erreur. Link to comment Share on other sites More sharing options...
JBENs Posted August 27, 2009 Share Posted August 27, 2009 Il y a une erreur justement !Si il n'y en avait pas, "Accès restreint par un fichier robots.txt" serait vide logiquement. J'ai des fichiers robots.txt sur d'autres sites et je ne rencontre pas ce problème ; sur tous les Prestashop si...D'où sortent ces URLs, la totalité de ces pages sont divers paniers remplis?Comment Google les connait-il si elle sont censées ne pas être indexées?Et dernière chose, pourquoi j'ai alors lorsque je tape dans Google "site:http://www.monsite.fr/cart.php" une page indexée (et des "pages similaires") alors que je rappele que le fichier robots.txt interdit l'indexation...Merci Link to comment Share on other sites More sharing options...
Gregory Roussac Posted August 28, 2009 Share Posted August 28, 2009 Il y a une erreur justement !Si il n'y en avait pas, "Accès restreint par un fichier robots.txt" serait vide logiquement. J'ai des fichiers robots.txt sur d'autres sites et je ne rencontre pas ce problème ; sur tous les Prestashop si...D'où sortent ces URLs, la totalité de ces pages sont divers paniers remplis?Comment Google les connait-il si elle sont censées ne pas être indexées?Et dernière chose, pourquoi j'ai alors lorsque je tape dans Google "site:http://www.monsite.fr/cart.php" une page indexée (et des "pages similaires") alors que je rappele que le fichier robots.txt interdit l'indexation...Merci Ces urls sortent des liens sur votre site. Ajouter une quantité par exemple. Ce ne sont pas de paniers. Les paniers sont sur order.php. Il les connait car il parse le site mais en théorie ne les indexe pas.Pour la dernière question, je ne sais, il faut s'adresser à Google....Peu être à cause des paramètres de l'url.... Link to comment Share on other sites More sharing options...
JBENs Posted August 28, 2009 Share Posted August 28, 2009 Toutes ces pages redirigent vers des pages du type: http://www.monsite.fr/order.php?ipa=100 donc c'est bien différents paniers remplisCes pages là ne sont pas appelées sur mon site via des liens internesSur 4 sites fait en prestashop, j'ai le même soucis...Quelqu'un a-t-il le même soucis que moi? Link to comment Share on other sites More sharing options...
Baballe Posted October 6, 2009 Share Posted October 6, 2009 Bonjour,Peut être un début de réponse icihttp://forum.webrankinfo.com/probleme-url-acces-restreint-par-fichier-robots-txt-t115723.html Link to comment Share on other sites More sharing options...
ps_93 Posted February 8, 2010 Share Posted February 8, 2010 J'ai la même erreur...Sauf que moi il me met également, avec les liens cart.php,http://www.xxxxxx.fr/modules/sendtoafriend/sendtoafriend-form.php?id_product=1149,URL à accès restreint par un fichier robots.txt,25/01/10http://www.xxxxxx.fr/modules/askinfoproduct/askinfoproduct-form.php?id_product=984,URL à accès restreint par un fichier robots.txt,25/01/10http://www.xxxxxx.fr/addresses.php,URL à accès restreint par un fichier robots.txt,27/01/10As tu réussi à résoudre le problème?Cela va t-il empêcher Google de bien indexer mon site?Voici mon fichier robots.txt généré par PS : # robots.txt automaticaly generated by PrestaShop e-commerce open-source solution# http://www.prestashop.com - http://www.prestashop.com/forums# This file is to prevent the crawling and indexing of certain parts# of your site by web crawlers and spiders run by sites like Yahoo!# and Google. By telling these "robots" where not to go on your site,# you save bandwidth and server resources.# For more information about the robots.txt standard, see:# http://www.robotstxt.org/wc/robots.htmlUser-agent: *# DirectoriesDisallow: /classes/Disallow: /config/Disallow: /download/Disallow: /mails/Disallow: /modules/Disallow: /translations/Disallow: /tools/# FilesDisallow: /addresses.phpDisallow: /address.phpDisallow: /authentication.phpDisallow: /cart.phpDisallow: /contact-form.phpDisallow: /discount.phpDisallow: /footer.phpDisallow: /get-file.phpDisallow: /header.phpDisallow: /history.phpDisallow: /identity.phpDisallow: /images.inc.phpDisallow: /init.phpDisallow: /my-account.phpDisallow: /order.phpDisallow: /order-slip.phpDisallow: /order-detail.phpDisallow: /order-follow.phpDisallow: /order-return.phpDisallow: /order-confirmation.phpDisallow: /pagination.phpDisallow: /password.phpDisallow: /pdf-invoice.phpDisallow: /pdf-order-return.phpDisallow: /pdf-order-slip.phpDisallow: /product-sort.phpDisallow: /search.phpDisallow: /statistics.phpDisallow: /zoom.php Link to comment Share on other sites More sharing options...
Guest Posted March 8, 2010 Share Posted March 8, 2010 Bon alors apres tout ce temps tu as resolu ton probleme?Car moi ca me fait pareils.Tiens moi au jus, laisse pas les autres dans la mouise.Merci a+ Link to comment Share on other sites More sharing options...
Melki-Tsedeq Posted March 8, 2010 Share Posted March 8, 2010 Bonjour à tous.Si vous rencontrez des difficultés avec votre robots.txt cela peut être du au générateur de fichier robots.txt de l’Admin voir : [Résolu] Bug générateur de fichiers robots.txt Cordialement.Melki-Tsedeq Link to comment Share on other sites More sharing options...
Recommended Posts
Create an account or sign in to comment
You need to be a member in order to leave a comment
Create an account
Sign up for a new account in our community. It's easy!
Register a new accountSign in
Already have an account? Sign in here.
Sign In Now