Prevot Daniel Posted March 19, 2010 Share Posted March 19, 2010 BonjourJe suis victime d'un robot, apparament voilabot qui est en permanence connecté a mon siteil reste 15 minute puis revient avec une autre ip. il est connecté souvent de 4 A 10 fois en même temps avec une adresse ip différente. comment bloquer ce robot.Merci de vos reponseDaniel Link to comment Share on other sites More sharing options...
Olecorre Posted March 19, 2010 Share Posted March 19, 2010 Bonjour,Une piste avec un fichier robot.txt, tu as une description la : http://www.commentcamarche.net/contents/web/robots-txt.php3Cdt Link to comment Share on other sites More sharing options...
Prevot Daniel Posted March 21, 2010 Author Share Posted March 21, 2010 Bonjour.le robot.txt n'y a rien fait.j'ai banni les adresses ip.Order Allow,DenyAllow from allorder allow,denydeny from 193.252.149.13deny from 193.252.149.14deny from 193.252.149.15deny from 193.252.149.16deny from 193.252.118.173deny from 193.252.118.174deny from 193.252.118.175deny from 193.252.118.176deny from 81.52.143.15deny from 81.52.143.16deny from 81.52.143.29deny from 81.52.143.26deny from 81.52.143.30deny from 81.52.143.31deny from 81.52.143.32deny from 81.52.143.33deny from 81.52.143.34deny from 81.52.143.35deny from 81.52.143.36deny from 81.52.143.37par un tracert elles pointent toutes vers le seveur: natcrawlbloc03-04.net.m1.fti.netmaintenant j'ai 240 visites en moins par joursur le web ce serveur est donné pour être à voila!!!!!je leur ai écritje vais voir par la suite!bonne journnée Link to comment Share on other sites More sharing options...
Melki-Tsedeq Posted March 21, 2010 Share Posted March 21, 2010 Bonjour DanielUne non indexation peut être mise en place : il s'agit d'empêcher VoilaBot de rentrer sur le site. L'instruction est facile à mettre en place et c’est au niveau du fichier .htaccessSi ce n'est pas déjà fait dans votre fichier .htaccess, pensez à activer l'url-rewriting : RewriteEngine on RewriteBase / Puis, intégrer les instructions de redirections pour dérouter le robot Voilà : RewriteCond %{REMOTE_HOST} ^natcrawlbloc.* [OR] RewriteCond %{HTTP_USER_AGENT} VoilaBot [OR] RewriteCond %{REMOTE_HOST} ^193.252.149.13 RewriteRule .* - [F,L] Le robot de VoilaBot est redirigé vers une page d'erreur simple, n'effectuant aucune connexion à la base, pour éviter les surcharges.Cette instruction est plus forte qu'une instruction dans le fichier robots.txt que le bot peut ignorer.CordialementMelki-Tsedeq Link to comment Share on other sites More sharing options...
Prevot Daniel Posted March 21, 2010 Author Share Posted March 21, 2010 Bonjour Melkije pas sur que se soit voilabot car j'ai changer les mot clé depuis plusieurs jour et ils n'ont pas changé sur le moteur de recherche. Je crois que c'est un robot autre qui passe par le serveur de voila. de plus j'ai supprimé le fichier robot.txt et je n'ai pas de problème pour l'instant. Tu en penses quoi???Daniel Link to comment Share on other sites More sharing options...
Prevot Daniel Posted March 21, 2010 Author Share Posted March 21, 2010 le fichier .htaccess doit contenir url-writing on comme je l'ai posté c'est suffisant??Tu crois que voilabot est vraiment un mauvais robot?merci pour tes réponsesDaniel Link to comment Share on other sites More sharing options...
Melki-Tsedeq Posted March 26, 2010 Share Posted March 26, 2010 Bonjour Daniel.Je vous confirme c’est bien le robot de voila.Le VoilaBot effectue un travail de recherche pour le moteur présent sur orange.fr, voila.fr et lemoteur.frD’où les IP différentes, et il faut dire qu’il est encore en version Bêta et parfois il fait un peu n’importe quoi, il va même chercher des pages qui n’existent pas !Je ne supprimerais pas le fichier robots.txt car les robots l’utilisent dans la plus part des cas pour savoir ce qu’ils sont autorisés a indexé.Le fichier .htaccess ne doit pas forcément contenir url-writing sauf si vous utiliser la redirection ou la réécriture url. Et comme vous l’avez posté c’est suffisant pour un bannissement d’IP.Je ne crois pas que voilabot est vraiment un mauvais robot mais parfois il fait n’importe quoi et quand ça arrive et qu’il prend de la ressource je le banni aussi pour éviter les surcharges. Vous pouvez également contacter le support de VoilaBot.Si vous rencontrez des difficultés avec le robot VoilaBot ou sur le référencement de votre site sur orange.fr, voila.fr et lemoteur.frVous pouvez contactez le support du Moteur afin de régler avec leurs équipes les paramètres de parcours de votre site.Cordialement.Melki-Tsedeq Link to comment Share on other sites More sharing options...
Deliss Posted March 29, 2010 Share Posted March 29, 2010 Bonjour,J'ai le même souci que Daniel depuis plusieurs jours maintenant....Voici les adresses :193.252.118.175 12:49:21 best-sales.php - accès direct -81.196.113.134 12:11:24 product.php images.google.ro193.252.118.174 11:53:00 search.php - accès direct -193.252.118.173 11:24:55 manufacturer.php - accès direct -Avez vous trouver une solution, je ne suis pas très douée à la matière en ce qui concerne ce genre de chose.Pouvez-vous m'éclairer s'il vous plait.Cela engendre t-il des conséquences à notre boutique ?Merci par avance de votre réponseCordialement Link to comment Share on other sites More sharing options...
Prevot Daniel Posted March 29, 2010 Author Share Posted March 29, 2010 Bonjour de delissIl faut reperer le adresses ip qui viennent du robot et celles des clients.IP 81.196.113.134 12:11:24 est,a mon avis, d'un client.donnes ton adresse msn on pourra en parler.Daniel. Link to comment Share on other sites More sharing options...
Deliss Posted March 31, 2010 Share Posted March 31, 2010 Bonjour,Le robot est encore sur mon site pfff1247 81.52.143.30 12:56:45 product.php - accès direct - 1246 81.52.143.30 12:16:21 product.php - accès direct - 1245 81.52.143.37 11:50:03 manufacturer.php - accès direct - Mon adresse msn : [email protected]Merci beaucoup Link to comment Share on other sites More sharing options...
surfshop Posted September 21, 2010 Share Posted September 21, 2010 bonjour il en est de même pour moi,Cela a t'il une incidence ou pas. Link to comment Share on other sites More sharing options...
bleach Posted January 9, 2011 Share Posted January 9, 2011 liste officiel reçu de orange par mails suite a une plainte de ma part Bonjour,Le Support Voilabot est le mail de contact pour le robot de collecte dumoteur de recherche d'Orange Portail.81.52.143.1581.52.143.1681.52.143.2681.52.143.2981.52.143.3081.52.143.3181.52.143.3281.52.143.3381.52.143.3481.52.143.3581.52.143.3681.52.143.37193.252.118.173193.252.118.174193.252.118.175193.252.118.176193.252.149.13193.252.149.14193.252.149.15193.252.149.16Nous souhaitons vous assurer que Orange attache la plus grandeimportance à l'amélioration constante de la qualité de ses services.Nous vous prions de bien vouloir nous excuser pour le désagrémentoccasionné.Merci de votre confiance,Bien cordialement,L'équipe VoilaBot. Link to comment Share on other sites More sharing options...
N°6 Posted November 6, 2015 Share Posted November 6, 2015 (edited) Bonjour, Je déterre ce topic toujours d'actu. En effet, il faut savoir que ces bots orange peuvent provoquer une montée artificielle de vos visiteurs dans vos stats (+ de 1000 visites en plus dans mes stats par jour en ce moment à cause de ces robots) Si vous voulez vous en débarrasser pour libérer des ressources, voici la liste mise à jour des ips des bots de orange/voila à bloquer sur votre site : 81.52.143.1581.52.143.1681.52.143.2681.52.143.2981.52.143.3081.52.143.3181.52.143.3281.52.143.3381.52.143.3481.52.143.3581.52.143.3681.52.143.37193.252.118.164193.252.118.166193.252.118.167193.252.118.173193.252.118.174193.252.118.175193.252.118.176193.252.118.179193.252.149.13193.252.149.14193.252.149.15193.252.149.16 Petite info : OVH s'y met aussi : un bot difficile à repérer mais qui peut passer pourtant sur votre site jusqu'à 150 fois dans la journée (au moins dans mon cas) : 37.187.137.225 Voilà, si cela peut être utile à quelqu'un. Edited November 6, 2015 by N°6 (see edit history) Link to comment Share on other sites More sharing options...
Oron Posted November 6, 2015 Share Posted November 6, 2015 Bonjour Vous pouvez installer Crawl Protect et CRawl Tracker qui protège vos sites c'est des programmes gratuit plutôt faire un don http://www.crawltrack.fr/crawlprotect/ Et là vous pourrez configurer protéger des dossiers etc. Vous avez juste besoin d'une base de donnée, de préférence en plus de celle de votre e-commerce. Link to comment Share on other sites More sharing options...
Eolia Posted November 6, 2015 Share Posted November 6, 2015 hum... crawlprotect + Prestashop, ce n'est pas le couple idéal hein, vous allez avoir de sérieux problèmes de droits. Link to comment Share on other sites More sharing options...
N°6 Posted November 7, 2015 Share Posted November 7, 2015 Bonjour, Pour ma part j'ai opté pour un module qui bloque les ips indésirables. J'ai juste besoin de regarder les ips des indésirables dans un module qui indique toutes les ips des visiteurs, de les repérer (facile) puis de les copier/coller dans le module bloqueur. Ca fonctionne parfaitement. Ces deux modules sont tops mais je ne ferai pas de pub ici. Ca me prend 5 minutes chaque jour. Link to comment Share on other sites More sharing options...
Fred Posted January 13, 2018 Share Posted January 13, 2018 Même souci de connexions massives sur mon site. J'ai beau mettre à jour mon .htaccess et robot.txt, le problème est que Prestashop 1.7.2.4 remet ces fichiers à jour en écrasant mes lignes. Il semblerait que (dans la limite infinie de mes connaissances limitées) l'option d'un module dédié soit la solution. Link to comment Share on other sites More sharing options...
Oron Posted January 13, 2018 Share Posted January 13, 2018 Bonjour Le robots.txt n'a d’efficacité que si les robots sniffeur respecte le robots.txt http://robots-txt.com/ressources/ 1 Link to comment Share on other sites More sharing options...
Recommended Posts
Create an account or sign in to comment
You need to be a member in order to leave a comment
Create an account
Sign up for a new account in our community. It's easy!
Register a new accountSign in
Already have an account? Sign in here.
Sign In Now