Spam des commentaires

BlogContainers15 août 2018

Pour lutter contre le spam dans les commentaires du blog, j'ai opté pour la simplicité dès le début parce que l'audience est restreinte, que je ne veux pas compliquer la vie des lecteurs avec des systèmes de captchas (de plus en plus illisibles d'ailleurs) et que je veux préserver l'accès au blog sans JavaScript pour les durs, les vrais, les tatoués ;-)

Ma naïve défense est basée sur un pot de miel : un champ caché dans le formulaire de saisie de commentaire, invisible pour l'humain normalement constitué, qui ne peut donc être rempli que par un bot qui analyse les pages HTML. Ces commentaires sont jetés directement par mon gestionnaire de commentaires Stacosys. Pendant longtemps, ce fut une défense suffisante ; de rares fois un facheux postait un commentaire pour me vanter un site de vente de pilules : je refusais le commentaire et voilà.

Mais depuis quelques temps, je reçois des rafales de spams : soit les robots sont plus efficaces et analysent aussi la CSS de la page, soit quelqu'un a embauché une armée de zombies pour poster manuellement sur tous les sites à moins de 100 visiteurs / jour. J'ai donc mis en place une 2ème ligne de défense. Quand j'étiquète spam le commentaire, Stacosys écrit une ligne de log avec l'adresse IP du spammeur, et fail2ban ajoute une règle iptables pour le bannir. La méthode n'est pas révolutionnaire, ça a demandé quelques lignes de code dans Stacosys ; ce qui est plus intéressant, c'est sa mise en oeuvre dans une architecture Docker avec un reverse proxy.

Architecture Docker blog

Nginx joue le rôle de reverse proxy, il balance les requêtes du blog vers Hugo et le post du formulaire vers Stacosys. Pour ne pas perdre l'adresse IP réelle du visiteur, on la propage jusqu'à Stacosys dans l'attribut HTTP X-Forwarded-For.

On a une configuration NginX de ce genre :

location /newcomment {
    proxy_set_header Host $host;
    proxy_set_header X-Real-IP $remote_addr;
    proxy_set_header X-Forwarded-For $remote_addr;
    proxy_pass http://stacosys:8100/newcomment;
}

location / {
    proxy_set_header Host $host;
    proxy_set_header X-Real-IP $remote_addr;
    proxy_set_header X-Forwarded-For $remote_addr;
    proxy_pass http://nginx-blog;
}

Stacosys est un container Docker donc l'application (PID 1) écrit ses logs dans la sortie standard (STDOUT) ; c'est le comportement par défaut. Mais, afin d'ajouter des règles iptables, le container fail2ban a besoin de lire ces logs. On va donc exporter les logs de stacosys vers le container logger en rajoutant une section logging dans le fichier docker-compose qui décrit le lancement du service stacosys :

logging:
  driver: syslog
  options:
    syslog-address: "tcp://127.0.0.1:514"
    tag: "stacosys"

et le container logger, qui n'est rien d'autre qu'un serveur syslog, écrit ses logs dans un volume Docker :

logger:
    image: bobrik/syslog-ng
volumes:
    - syslog:/var/log/syslog-ng
ports:
    - "514:514"

Le volume de données syslog est partagé avec le container fail2ban qui peut ainsi lire les logs de stacosys, appliquer ses règles de filtrage et définir dynamiquement des règles iptables pour bannir les vilains.

Gyom - 2018-08-16 07:23:16

Sympa l'astuce, même si ça semble nécessiter quelques compétences d'administration système pour être mettre en place. Il ne serait pas envisageable de bloquer les commentaires par avance sur un critère comme la langue du navigateur, si l'audience du site est uniquement française ?

DaScritch - 2018-08-16 07:25:26

J'ai mis Askimet sur mon Dotclear depuis des années. Très très peu de faux positifs, quelques faux négatifs, mais les vagues sont parfaitement bloquées.

Yax - 2018-08-16 08:23:02

@Gyom La langue du navigateur pourrait être un critère mais je risquerai de bloquer des lecteurs utilisant un VPN.

@DaScritch je compte rester sur une solution DIY. Si je dois trop classer manuellement, j'envisagerai une évolution de Stacosys avec du machine learning.

Arnauld - 2018-11-04 15:24:52

Bonjour,

j'ai également un blog sous Hugo. Comment installer le système de commentaires Stacosys ? J'utilise Yunohost. Merci si vous avez le temps de me donner un conseil ou un lien.

Arnauld

Yax - 2018-11-04 16:00:52

Bonjour Arnauld,

Je ne connais pas Yunohost mais je crois qu'il y a un format d'empaquetage à respecter pour fabriquer une application Yunohost. D'ailleurs je n'ai vu aucun système de commentaires dans les applications Yunohost officielles et taggués working.

Stacosys est brut de fonderie : il exige un e-mail dédié, des templates spécifiques dans Hugo et la procédure d'installation est à décider. Je ne pense pas qu'il soit le meilleur choix à moins d'avoir envie de mettre les mains dans le cambouis, de rentrer dans le code, de se l'approprier pour l'améliorer, bref pour le plaisir.

Pour mettre en place une solution supportée, documentée je te conseillerai plutôt de regarder les alternatives connues. Hugo en recense quelques unes ici

Isso et Static Man sont assez connus mais l'installation sous Yuno reste à éclaircir. Tu peux peut-être voir dans les forums de Yuno qu'est-ce qui est mis en place par les gens qui auto-hébergent leur blog statique sous Yuno. Il y a bien sûr l'alternative Disqus... on n'en a parlé mais je ne pense pas que tu aies envie de confier tes commentaires à un tiers.

Yax

Arnauld - 2018-11-05 02:02:52

Merci Yax. Je vais essayer d'installer Isso à la place de Disqus que j'utilise actuellement.

Votre commentaire