Jump to content

[PS 1.25] Sitemap ET Google: url introuvable


samsab

Recommended Posts

Salut,

Sans connaitre l'historique c'est difficile.

Ainsi, tes pas sont en erreur 404 donc introuvable. Est ce que ces pages existent vraiment ? ou non.
Est ce des pages qui sont indisponibles à un moment car tu as mis ta boutique en maintenance ?
Est ce une ancienne version de ton site ?

Link to comment
Share on other sites

Bonjour à tous deux.
merci pour vos réponses.
Aline: je prends note, je regarde et je reviens ici donner réponse.
Jeckyl: site non en maintenance, version récente et unique, par contre j'ai un pb dan la définition du "Bloc Lien"
en effet le bloc lien contient ......des liens avec une url pour chacun de ces liens; ok tout va bien, MAIS le bloc lien est défini lui même par le titre du bloc (ok tout va bien) MAIS aussi par une url???? j'en ai mis une, mais celle ci génère une erreur pour 2 raisons: comme url j'ai mis "BtoB" (BtoB.php ou BtoB.html eut été mieux certainement) mais de toute façon je n'ai aucune page BtoB.php ou BtoB.html..........

Donc l'erreur doit perdurer si il n' y a pas de contenu créé.

Qu'en pensez vous?
A+

Link to comment
Share on other sites

Bonjour

Exemples de sitemap et créer sur http://www.xml-sitemaps.com/

http://www.**********.fr/9728-serveur
2010-01-02T18:40:46+00:00
weekly
0.80



http://www.**********.fr/9741-sauvegarde-nas
2010-01-02T18:40:46+00:00
weekly
0.80





http://www.**********.fr/camera/66-camera-sous-marine-rotative-dans-sa-malette.html

2010-01-02T18:40:46+00:00
weekly
0.80





http://www.**********.fr/69-windows-7-premium-oem-32-bits.html

Avec quelque modification des liens inutile et langue en moins.

Link to comment
Share on other sites

re

Le robots.txt indique aux moteurs de recherches de Ne pas Référencer mais ne les bloques pas, c'est pas une barrière

Robots.txt, ou le fichier d'exclusion des robots, est une ressource de format texte qui peut être placée à la racine d'un site Web, et qui contient une liste des ressources du site qui ne sont pas censées être indexées par les robots d'indexation des moteurs de recherche. Par convention, les robots consultent robots.txt avant d'indexer un site Web. Sur le serveur Web, cette ressource est fréquemment enregistrée dans un fichier texte appelé robots.txt.
(source wikipedia)

Par contre je suppose que si dans un fichier tu lui dit de ne pas y aller et dans l'autre d'y aller, il va se dire, il est fou ce type il sait pas ce qu'il veut.

Link to comment
Share on other sites

tu veux dire que le générateur de sitemap est indépendant de la définition faite du robots.txt?
c'est vrai quand je génère moi même ce fichier

dans mon cas je ne crois pas que cela impacte tiens je vais verifier......
ouhla je trouve cela
cela semble être généré pas ps.
je suis étonné du Disallow: /modules/
au vu de mes erreurs, voici possiblement une explication.

qui utilise le robots.txt sorti tout droit de prestashop?



pour le reste je n'ai pas d'avis

# robots.txt automaticaly generated by PrestaShop e-commerce open-source solution
# http://www.prestashop.com - http://www.prestashop.com/forums

# This file is to prevent the crawling and indexing of certain parts
# of your site by web crawlers and spiders run by sites like Yahoo!
# and Google. By telling these "robots" where not to go on your site,
# you save bandwidth and server resources.

# For more information about the robots.txt standard, see:
# http://www.robotstxt.org/wc/robots.html

User-agent: *

# Directories
Disallow: /classes/
Disallow: /config/
Disallow: /download/
Disallow: /mails/
Disallow: /modules/
Disallow: /translations/
Disallow: /tools/

# Files
Disallow: /addresses.php
Disallow: /address.php
Disallow: /authentication.php
Disallow: /cart.php
Disallow: /contact-form.php
Disallow: /discount.php
Disallow: /footer.php
Disallow: /get-file.php
Disallow: /header.php
Disallow: /history.php
Disallow: /identity.php
Disallow: /images.inc.php
Disallow: /init.php
Disallow: /my-account.php
Disallow: /order.php
Disallow: /order-slip.php
Disallow: /order-detail.php
Disallow: /order-follow.php
Disallow: /order-return.php
Disallow: /order-confirmation.php
Disallow: /pagination.php
Disallow: /password.php
Disallow: /pdf-invoice.php
Disallow: /pdf-order-return.php
Disallow: /pdf-order-slip.php
Disallow: /product-sort.php
Disallow: /search.php
Disallow: /statistics.php
Disallow: /zoom.php

Link to comment
Share on other sites

Re

cela semble être généré pas ps.
je suis étonné du Disallow: /modules/
au vu de mes erreurs, voici possiblement une explication.


Pourquoi étonné du Disallow : /modules/ ?? A quoi servirait de référencer le dossier modules ?
Avec tous les dossiers et fichiers ça en ferait une tonne inutile, le visiteur qu'est-ce qu'il en à faire de ton module blockcategorie ou du blockcategorie.tpl il cherche un siège pour bébé et va trouver trois page de google où on lui parle que de block machin truc, c'est un site de fou ça poufff!

Disallow: /footer.php a quoi servirat de référencer le footer.php.

Et comme c'est écris le fait de dire au robot de ne pas visiter ces pages, préserve la bande passante.
Et exemple le dossier créer /images/ pour le importer avec le fichier csv est aussi inutiles de le référencer.

Link to comment
Share on other sites

ta réponse m'étonne parceque si tu regardes la liste des url (voir 1ere image du post) pour lesquelles google signale une erreur, il y a justement des url en xxx/module/yyyy

d'où mon étonnement sur la restriction incluse dans le robots.txt, lui même généré par PS.
il semble, si j'ai bien compris, que PS genere un site map avec entre autres des xxx/module/yyyy, et, de l'autre coté dit au moteur de ne pas aller sur /module

n'est ce pas incohérent?

A te lire

Link to comment
Share on other sites

Par contre je suppose que si dans un fichier tu lui dit de ne pas y aller et dans l'autre d'y aller, il va se dire, il est fou ce type il sait pas ce qu'il veut.


Salut,

Ben, non, car en informatique souvent on fait une inclusion d'une ensemble important de données et on fait souvent une exclusion de la partie que nous ne voulons pas, car c'est souvent plus simple que d'intégrer la partie que l'on veux.

Mais il est surement possible de revoir le codage du sitemap pour qu'il n'indexe pas les éléments non désirés. un petit stripos() dans un if et on refuse l'indexation, par contre cela se configurer en dure ce qui n'est pas parfait.
Link to comment
Share on other sites

Re

n'utilisent pas le sitemap de prestashop il est pas conforme va sur le site http://www.xml-sitemaps.com/

tu regardes la liste des url (voir 1ere image du post) pour lesquelles google signale une erreur, il y a justement des url en xxx/module/yyyy


Si google dit qu'il y a des erreurs c'est qu'il y a des erreurs et n'est pas conformes (google est ton ami il ne ment pas) :) et le papa du sitemap c'est google :ahhh:

Et après quelque correction à faire enlever les inutiles.

une inclusion d’une ensemble important de données et on fait souvent une exclusion de la partie que nous ne voulons pas


oui dans la programmation mais là c'est pour le web, par contre je sais pas si le robots va se dire attends là c'est une inclusion et là une exclusion houlàà où suis-je :)

Et c'est idiot de lui dire en premier ne va pas ici et après tu lui dit si va la dedans
Tous les dossier indiquer dans le robots.txt n'ont aucun intérêt à être indexé.
Link to comment
Share on other sites

Bonjour

L'argent du beurre, le beurre et le pain en prime :)

Pour 14 euros et 14 cents il y a la version Illimité , je n'ai pas vu si c'est pour un an ou seulement une fois à vie, mais même si c'est pour un an je pense que ça vaut la peine.

Link to comment
Share on other sites

  • 2 weeks later...

Tout ce que tu a à faire c'est mettre ton fichier xml en ligne et de donner à google l'url de ce lien ;)

du genre, si tu le met à la racine de ton site, l'url sera : http://www.monsite.com/sitemap.xml

Sinon pour ma part, je génère le sitemap avec le module déjà dispo sur prestashop et ensuite j'utilise ça : http://www.sitemapdoc.com/EditMap.aspx# pour éditer les fréquences de changement et priorité (ça prend deux secondes) je le transfert sur mon fichier via macromedia dreamweaver (deux secondes aussi) et zou je remet en ligne ;)

Link to comment
Share on other sites

Re Bonjour

Waouhh je viens de voir un sitemap.xml comme je les aimes voir ;-)
1 point Thomy83 :wow:

Sauf et ne sert à rien :

http://micro-techno.com/password.php
weekly
0.64


http://micro-techno.com/new-products.php?p=2
weekly
0.64

−

http://micro-techno.com/authentication.php
weekly
0.51



ces trois fichiers, password et authentification plutôt mettre dans le robots.txt
:-)

Link to comment
Share on other sites

Re

Ce qui est bien c'est :

http://micro-techno.com/24-apple-iphone
weekly
0.80

−

−

http://micro-techno.com/accessoires-iphone-dock-station-acceuille/26-station-d-accueil-dock-transmetteur-fm.html

weekly
0.80



le titre des catégories et des pages : 26-station-d-accueil-dock-transmetteur-fm.html et c'est plus propre, clair, compréhensif.
le sitemap généré par prestashop mets de fichier products?id=2 dans ce genre là

Y a encore à enlever inutile

http://micro-techno.com/order.php
weekly
0.80

−

−

http://micro-techno.com/authentication.php?back=my-account.php

weekly
0.80

Link to comment
Share on other sites

Mea Culpa

−

http://micro-techno.com/content/5-paiement-securise

weekly
0.80

−

http://micro-techno.com/prices-drop.php
weekly
0.80



au debut

http://micro-techno.com/order.php
weekly
0.80



Et le dernier

http://micro-techno.com/new-products.php?p=2
weekly
0.64



Ces liens ne vont rien rapporter, le visiteur qui cherche un produits précis veut un lien direct sur le produits ou sur l'index du site

Link to comment
Share on other sites

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!

Register a new account

Sign in

Already have an account? Sign in here.

Sign In Now
×
×
  • Create New...