Mesures anti-hotlink et anti-leech

Comme la plupart des webmasters, vous avez sans doute déjà eu à faire au robot Googlebot-Image, qui référence toutes les superbes photos, les snapshots, ou les créations personnelles de votre site sur le moteur de recherche d’images Google

Que Google référence vos images et voilà une ribambelle de hotlinkeurs qui profitent de l’occasion pour utiliser vos photos et votre bande passante à tire larigot !

Donc, vous vous demandez sûrement comment empêcher les crawlers d’images en tous genres de référencer toute votre galerie de photos perso et vous éviter la catastrophe !?

Une partie de la solution réside dans un simple fichier robots.txt et dans quelques lignes de rewriting dans un fichier .htaccess placé à la racine de votre site, comme nous allons le voir dans cet article…

Eh oui, sur Internet c’est comme ça ! Dès que quelqu’un trouve une image ou une photo qui lui plait, accessible depuis l’extérieur du site d’origine, il s’en sert pour ses propres créations !

C’est ce qu’on appelle du hotlinking ou du vol de bande passante, par l’utilisation d’un fichier (généralement une belle photo) publié sur un autre site web que celui ou il est affiché.

Cette technique de « hotlink’ est très utilisée dans le monde des forums mais elle est surtout très désagréable pour le webmaster qui se fait littéralement piller sa bande passante !

Interdire l’indexation de vos images

La première chose à faire, lorsqu’on héberge beaucoup d’images ou de vidéos qui consomment de la bande passante, c’est d’installer un fichier robots.txt à la racine de son site afin d’interdire les robots Googlebot-Image et autres…

Voici ce qu’il faut mettre dans votre robots.txt pour empêcher l’indexation de vos images :


User-Agent: *
Allow: /

User-Agent: Googlebot-Image
Disallow: /

La première ligne concerne tous les robots (*) qui sont autorisés par défaut sur tout le site par la deuxième ligne.

La quatrième et la cinquième ligne concernent uniquement le robot « Googlebot-Image » et lui interdisent toute l’arborescence du site depuis la racine.

Une fois enregistré à la racine de votre site, ce fichier robots.txt autorisera l’accès à votre site à tous les robots crawlers, sauf à Google-Image, ce qui lui évitera d’être référencé sur le moteur de recherche d’image Google.

La technique du référer

Si vous avez accès aux fonctionnalités des .htaccess et du mod_rewrite d’Apache, il existe une solution qui empêche l’accès à certains fichiers, si leur référent ne provient pas du site d’origine.

Grosso-modo, lorsqu’un internaute affichera une image sur un site X, en provenance de votre site Y, le serveur Apache refusera l’accès à ce fichier en renvoyant une erreur 403 Forbidden.

Voici le code à placer dans votre fichier .htaccess pour éviter le hotlinking d’images sur votre site :


# anti-leech && hotlinking
RewriteCond %{HTTP_REFERER} !^$
RewriteCond %{HTTP_REFERER} !^http://(www\.)?mondomaine.com(/)?.*$ [NC]
RewriteRule .*\.(gif|GIF|jpg|JPG|bmp|BMP)$ - [F]

Dans ce code, toutes les images qui seront affichées à partir de sites différents de « mondomaine.com » seront refusées avec le code 403 Forbidden (code [F] à la fin de la ligne RewriteRule).

Le seul défaut de ce script provient de la première ligne RewriteCond qui autorise le reférer NULL, renvoyé par le navigateur client lors d’un accès depuis une page interne du site, qui peut être « spoofée » avec un browser évolué…

Il est possible de jongler avec les commandes du mod_rewrite pour, par exemple, rediriger vers une image unique anti-leech.

Restez ZEN

Quoiqu’il arrive, dites-vous que ce n’est pas grave ! Nous avons tous été au-moins une fois confrontés à un abominable hotlink provenant d’un forum à fort trafic qui a pollué notre bande passante pendant quelques temps…

Il y aura toujours un idiot quelque part pour vous casser les c……s, alors par pitié, restez ZEN !

A ma connaissance, il n’y a que ces deux techniques combinées qui donnent de bons résultats. Essayez déjà avec ça et si vous avez d’autres astuces, lâchez les commentaires !!!

Tags: , , , ,

Laisser un commentaire

*

domiciliation commerciale - gérant salarié - e-book à télécharger - capital risque - rachat de crédit
gagner un revenu - Infopreneur - certificat de non-gage - activités lucratives