Jump to content

[RESOLU]Probleme robots.txt


Recommended Posts

Bonjour la communauté,

J'essaye actuellement de généré le fichier robots.txt et peanut...
Résumé:
chez Planethoster en mutualisé, presta V.1.2.1
URL simplifié possible donc activée,.htaccess généré (et regénéré après tentative selon ce que j'ai pu lire ici), création d'un fichier vide robots.txt au niveau de public_html/adminMSM...lancement par http://www.monsite.com/robots.txt : et je tombe sur une page me disant "page introuvable : la page que vous avez demandée n'existe PLUS"...??!!

Cela inspire-t-il qlq'un car j'ai fais le tour du forum sur le sujet et apparement, les problèmes ne sont pas similaires...

Merci d'avance et doux day à tous !

Link to comment
Share on other sites

Avec bloc-notes?

Bonjour Alain,

non...euh, ça va (surement) faire rire mais bon, je suis un brin newbie dans le domaine : dans le back office, il y'a indiqué "génération du fichier" cependant il n'y a pas de touches clicable comme pour le .htaccess juste au-dessus, j'ai donc créer le fichier puis suis aller sur mon site dans mozilla en tapant l'adresse http://www.monsite.com et ai lancer..."page introuvable" apparait alors...

Comment utiliser le bloc-note, c'est à dire où trouver le texte a y mettre, s'il te plait (puisqu'il n'y a de génération automatique dans le B-O) ?

:)
Link to comment
Share on other sites

Avec bloc-notes?

Bonjour Alain,

non...euh, ça va (surement) faire rire mais bon, je suis un brin newbie dans le domaine : dans le back office, il y'a indiqué "génération du fichier" cependant il n'y a pas de touches clicable comme pour le .htaccess juste au-dessus, j'ai donc créer le fichier puis suis aller sur mon site dans mozilla en tapant l'adresse http://www.monsite.com et ai lancer..."page introuvable" apparait alors...

Comment utiliser le bloc-note, c'est à dire où trouver le texte a y mettre, s'il te plait (puisqu'il n'y a de génération automatique dans le B-O) ?

:)

Bon apparement, ce n'est pas la solution...pourtant c'était une possibilité puisque ça marche avec l'install photoshop et celle de crawltrack...utilisé le bloc et ftpété, ok, mais peux-tu me dire où je trouve le contenu/ un exemple de texte à mettre, s'il te plait ?
Link to comment
Share on other sites

Avec bloc-notes?

Bonjour Alain,

non...euh, ça va (surement) faire rire mais bon, je suis un brin newbie dans le domaine : dans le back office, il y'a indiqué "génération du fichier" cependant il n'y a pas de touches clicable comme pour le .htaccess juste au-dessus, j'ai donc créer le fichier puis suis aller sur mon site dans mozilla en tapant l'adresse http://www.monsite.com et ai lancer..."page introuvable" apparait alors...

Comment utiliser le bloc-note, c'est à dire où trouver le texte a y mettre, s'il te plait (puisqu'il n'y a de génération automatique dans le B-O) ?

:)

pour la generation automatique, il faut que le BO trouve un fichier du meme nom (meme avec rien dedans). Alors, et seulement , le bouton pour la generation automatique est activé.
tu crees donc un fichier robots.txt, vide, a la racine du site , et hop ....
Link to comment
Share on other sites

Désolé dans les choux et sur les marchés de noyelle ki commencent...

As tu eu ton fichier? sinon je te l'envoie par MP

Bonsoir Alain,
oui-oui, c'est le rush en ce moment !!!
J'ai fini par trouver effectivement, je l'avais placer au mauvais endroit donc le bouton du b-o ne s'afficher pas...!
Il est généré et tout, et tout : perfecto !

Merci à toi,
Je te souhaite des good deal à venir en cette période ! ;-)

Mlle !
Link to comment
Share on other sites


pour la generation automatique, il faut que le BO trouve un fichier du meme nom (meme avec rien dedans). Alors, et seulement , le bouton pour la generation automatique est activé.
tu crees donc un fichier robots.txt, vide, a la racine du site , et hop ....

C'est fait...l'erreur était bien l'endroit du fichier...
Mais maintenant que c'est fait, et merci de ton aide (!!), j'ai une question de newbie qui me trotte dans la tête...ben oui !
- LA question à 2 balle :
Pourquoi dans la liste des disallow #directories ne figurent pas certains fichiers situés à la racine comme, par exemple, contact, css, docs, img, js ou le fameux .htaccess ???
Les robots pourraient-ils lire le .htaccess alors que celui-ci est là pour assurer une certaine sécurité ?! :roll:
Y'a un truc qui m'échappe là... :wow: :-S

ça te parle ou je psychotte ? :red:
Nan, parce que la sécurité, faut pas plaisanter...

Merci à toi, Zeiser50, pour ton aide,
Bonne soirée,
Mlle.
Link to comment
Share on other sites

Oui, le fichier robots.txt doit être à la racine de ton site (plus haut tu parles d'un dossier "Admin"...). De plus il doit avoir les permissions en chmod 777.

Merci Patrick, et à tous, pour votre aide !

Des fois, le terme "racine" n'est pas forcément clair pour un débutant...du coup j'ai chercher sur d'autres sites et ai trouver que la racine se situe au même niveau que le fichier index.php : si ça peut aider qlq'un dans le futur...
Je vais mettre un p'tit "résolu" au file...

Bonne soirée, :)
Mlle.
Link to comment
Share on other sites

Le fichier robots empêche les robots qui indexent ton site de référencer certains fichiers (pas de lecture possible). Les fichiers a la racine sont les fichiers standards (de PS) et donc, il n'y a pas d'intérêt a limiter l'accès.

La sécurité se fait plus par le .htacccess.

Du moins, c'est ma compréhension (je suis en phase newbie expert :-))

Link to comment
Share on other sites

Le fichier robots empêche les robots qui indexent ton site de référencer certains fichiers (pas de lecture possible). Les fichiers a la racine sont les fichiers standards (de PS) et donc, il n'y a pas d'intérêt a limiter l'accès.

La sécurité se fait plus par le .htacccess.

Du moins, c'est ma compréhension (je suis en phase newbie expert :-))

Je reste quand même en interrogation...
Je développe :
Le fichier robots.txt généré à la racine se situe à la même place que d'autres fichiers/dossier, dont le fameux .htaccess.
Or dans le contenu du robots.txt, il y'a une liste de disallow visant certains, mais pas tous, fichiers/dossiers situés au même niveaux que lui, c'est-à-dire à la racine...pourquoi seulement certains ?
Et pourquoi le .htaccess ne fait pas parti de la liste des disallow ? D'autant plus qu'il vise à la sécurité...a ton avis, est-il consutable par un robot ?
C'est ça en fait qui me fait buggé... :bug:

ça t'inspire qlq chose ? :roll:

Copier-coller du robots.txt, 1 ère partie :
# Directories
Disallow: /classes/
Disallow: /config/
Disallow: /download/
Disallow: /mails/
Disallow: /modules/
Disallow: /translations/
Disallow: /tools/
Link to comment
Share on other sites

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!

Register a new account

Sign in

Already have an account? Sign in here.

Sign In Now
×
×
  • Create New...