david997 Posted January 19, 2021 Share Posted January 19, 2021 (edited) Hola buenas, estoy auditando un sitio (con 355 URL indexadas en Google) en prestashop y a la hora de hacer un crawleo me da más 600.000 URL, el caso es que más del 95% de esas url son del "dominio/2-inicio?q=" y están canonicalizadas. Al abrir una de esas url aparecen sobretodo productos o marcas de la tienda con filtros... parece que cada combinación de filtros genera una URL y puede que por eso genere cientos de miles de URL... puede ser, alguien sabe de lo que hablo. Muchas gracias!! Edited January 19, 2021 by david997 ortographic (see edit history) Link to comment Share on other sites More sharing options...
juanrojas Posted January 19, 2021 Share Posted January 19, 2021 Hola creo que un Disallow: Noindex: en el robots.txt te ayudara Link to comment Share on other sites More sharing options...
david997 Posted January 19, 2021 Author Share Posted January 19, 2021 (edited) 33 minutes ago, juanrojas said: Hola creo que un Disallow: Noindex: en el robots.txt te ayudara Gracias por contestar lo primero!. Si, están bloqueadas en el robots.txt, la cosa era saber si esos cientos de miles de URL son realmente de eso, de las combinaciones de productos y sus filtros, no os suena que quizás prestashop haga eso? generar url por ls diferentes combinaciones? Edited January 19, 2021 by david997 ortographic (see edit history) Link to comment Share on other sites More sharing options...
angelfc Posted January 21, 2021 Share Posted January 21, 2021 Buenos días Acabo de ver este post, porque tengo un problema similar. A ver si me podéis echar una mano. En la paginación de mi tienda se han generado dos tipos de URLS: -midominio.com/zapatos-de-mujer-3#/page-2 -midominio.com/zapatos-de-mujer-3?p=2 La primera tiene una etiqueta canonical a la URL principal (zapatos-de-mujer-3) La segunda tiene una etiqueta canonical a la propia URL. Esto me genera duplicidades. Me podríais decir cómo eliminar esas URLs con la variable "?". Ya sé que puedo poner noindex en robots.txt, pero lo más probable es que me salgan más de este tipo. Si pudiera evitarlo sería lo ideal. Gracias por la ayuda Link to comment Share on other sites More sharing options...
Recommended Posts
Create an account or sign in to comment
You need to be a member in order to leave a comment
Create an account
Sign up for a new account in our community. It's easy!
Register a new accountSign in
Already have an account? Sign in here.
Sign In Now