WordPress et les captcha

Ce blog qui était épargné jusqu’ici a apparemment été récemment découvert par une machine à spam. Un bot s’entête en effet depuis quelques jours à me dire que mon bref article sur les interfaces du futur est génial, que c’est une bonne idée, qu’il devrait essayer, et autres compliments vides de sens, en anglais évidemment. Avec deux ou trois tentatives quotidiennes, ça reste néanmoins limité, sans commune mesure avec les centaines que des blogs plus importants subissent. Mais en grand fainéant cela suffit à me fatiguer au point de chercher une solution.

Celle qui me vient à l’esprit en premier est l’utilisation d’un captcha. Non pas une image d’un texte vu à travers un fond de bouteille de vodka préalablement vidée, mais juste une question absolument triviale, dont l’effet à déjà fait ses preuves à mes yeux. J’avais en effet déjà implémenté une telle fonction sur le forum de l’ancien site de Prologin avec la question « Combien font deux et deux ? », à laquelle il était possible de répondre en chiffres ou en lettres (ainsi que « 42 », à la demande de quelques candidats). Ce bout de code s’était révélé autrement plus efficace que le module Akismet, à l’effet très discutable, puisque l’on n’avait plus jamais eu le moindre problème depuis lors.

Néanmoins, plutôt que d’aller faire rentrer ça à la hache et au marteau comme précédemment, je me suis dit que quelqu’un avait déjà dû le coder sous forme de module, et qu’une petite recherche serait le plus simple. À défaut de m’avoir encore permis de trouver exactement ce que je cherche, elle aura été très instructive.

Tout d’abord il est partout conseillé d’utiliser Akismet, mais ayant constaté son échec sur le forum de Prologin, c’est la première chose que j’ai désactivée en mettant ce blog en ligne. De plus, sur un site plus important, je ne serais pas surpris que le traitement impliqué ait un coût.

Viennent ensuite les captcha à base d’images brouillées. Cette solution me semble poser quatre gros inconvénients.
Exemple de captcha

  • Tout d’abord elle est pénible : ce type de système me gène en tant qu’utilisateur, et j’imagine que c’est le cas de beaucoup d’autres, même sans aller jusqu’à des extrêmes comme ce grand gagnant (j’ai testé aussi, et je vous recommande de le faire, c’est proprement hallucinant : l’inscription au forum de pompiers.fr). La raison en est simple : il s’agit de chiffres et lettres aléatoires, qui n’ont donc aucun sens, et nécessitent de ce fait une certaine concentration.
  • De plus ces images sont souvent difficilement lisibles, comme le résume très démonstrativement cet article.
  • Ensuite la méthode manque d’accessibilité. Accessibilité, ce n’est pas un mot à la mode à sortir quand on n’a plus d’argument contre des technos qui permettent de faire des sites kikoolol avec des trucs qui clignottent. J’ai un ami qui utilise un clavier braille pour aller sur Internet : pour lui, l’accessibilité, c’est ce qui sépare le net auquel il a accès du reste.
  • Enfin, cette solution s’avère finalement peu efficace face aux progrès de la reconnaissance de forme. En janvier une équipe russe publiait en effet avec fracas un article de recherche traitant de reconnaissance de captcha, et annonçait un taux de réussite de 35% sur les images générées à l’époque par le site Yahoo!, ce qui est amplement suffisant pour en ruiner l’effet. D’ailleurs, sans recourir à ces approches techniques, d’autres spammeurs font lire les images par des utilisateurs en les mettant sur des sites à fort trafic, comme par exemple des sites pornographiques.

Au cours de cette recherche, j’ai également vu passer une méthode à base de son. Cette approche me semble être encore pire que la précédente, aussi je ne vais pas m’étendre plus.

Afin de se débarrasser de la gène occasionnée, certains modules tels que WP Captcha-Free ou WP-SpamFree utilisent le Javascript ou les cookies pour automatiser la reconnaissance du type de visiteur. C’est un moindre mal, mais imposer ces fonctions me gène, toujours pour des raisons d’accessibilité.

Enfin on arrive au méthodes textuelles. Les méthodes dites mathématiques (« arithmétiques » corrigeront les plus rigoureux) semblent être les plus populaires, en témoignent les citations fréquentes de Math Comment Spam Protection Plugin par exemple. Les méthodes textuelles on l’avantage de ne plus poser le problème de l’accessibilité, du moins quand elles restent raisonnables. Le lien que j’ai déjà cité donne quelques exemples d’abus qui en plus d’être tristement risibles, sont parfaitement inefficaces. Reconnaître une expression dans un texte et en retourner le résultat est en effet du domaine du trivial, et demander de calculer la deuxième sur deux ne fait que réduire le taux de réussite d’un bot à 50%. Aussi pénible et peu efficace est remarquable.

À mon avis l’efficacité d’un simple texte pour un captcha réside dans l’analyse sémantique qu’elle nécessite. « Quel fruit pousse sur un pommier ? » est une question simple, ne demandant aucune réflexion, mais qui requiert un traitement du langage qui nous met à l’abri pour cinq à dix ans au moins. WP-Gatekeeper fait partie des modules reposant sur cette technique. N’en ayant pas encore trouvé d’autres de ce genre, mon choix n’est cependant pas encore arrêté. Toute suggestion est d’ailleurs bienvenue. :-)

Pour finir, voici un article en anglais où l’auteur semble avoir constaté lui aussi une grande efficacité pour un bout de code écrit rapidement.

La crise financière au jour le jour

Je n’y connais quasiment rien en économie, mais lorsque j’ai vu ce gros titre sur le journal lu par un usager dans le métro, j’ai ri. Tirer ce genre de conclusion semble un peu hâtif.

20 Minutes, 14 octobre 2008 : Le sauvetage semble marcher

La crise économique actuelle est historique : on en parlera peut-être dans vingt dans les livres d’histoire comme la crise d’octobre 2008. Et nous aujourd’hui, on est dedans : on en est contemporains. On pourra dire à nos enfants : « J’y étais, je le suivais en direct sur Internet (un truc de pays riche qu’on avait) et je faisais F5 dans mon navigateur pour voir le CAC40 valoir 1% de moins à chaque fois ».

Les gouvernements font ce qu’il peuvent pour limiter les dégâts, mais il ne faut probablement pas s’attendre à ce que la reprise arrive tout de suite, bienveillante. Lorsque les scéances se succèdent avec des clôtures à plus ou moins 6%, voire atteignent deux chiffres, ce n’est pas en une scéance positive que tout va aller mieux. Ce qu’il se passe porte un nom : c’est la panique.

Aujourd’hui, sans surprise, c’est à nouveau la chute. Alors juste pour rire, je propose le gros titre suivant pour demain.

20 Minutes, 14 octobre 2008 : Le sauvetage semble marcher

D'un extrême à l'autre : du professionnalisme des ressources humaines

Il est intéressant de constater les différences qu’il peut y avoir entre les différentes entreprises dans leur façon d’aborder une personne dans le cadre du recrutement. Certaines sont réputées pour leur agressivité, tandis que d’autres au contraire sont d’un contact remarquable. Lorsque les unes s’assurent que les aspirations des personnes sont compatibles avec ce qu’elles ont à leur proposer, les autres se caractérisent par un désintérêt total pour cela. Voici deux exemples réels que je trouve opposés sur de nombreux points. Les informations nominatives ont bien entendu été retirées, mais si les auteurs lisaient cette page, ils se reconnaîtraient certainement.

D’un extrême…

N’étant pas en contact avec les partenaires ou clients de mon entreprise, je ne diffuse jamais mon adresse professionnelle à l’extérieur de mon travail. L’intégralité des mails que j’envoie et a fortiori reçois sont donc internes. Voici pourtant un mail reçu à cette adresse un beau matin.

Je cherche à vous joindre

Monsieur Guertault,

Suite à notre conversation téléphonique, je fais partie d’un cabinet de recrutement basé à Neuilly sur Seine.

Nous sommes mandatés par un éditeur de logiciel à taille humaine qui développe un procédé de dialogue interactif par l’intermédiaire de personnages animés (en 3 D) à distance pour pourvoir un poste de Chef de projet.

Je souhaiterais vous donner plus de détails sur ce poste. Si vous êtes potentiellement intéressé par cette opportunité, merci de me contacter rapidement et/ou de me faire parvenir un exemplaire de votre CV par retour de mail. Dans le cas contraire n’hésitez pas à transmettre mes coordonnées à toute personne à qui vous souhaiterez le faire.

Cordialement,
Sonia Padouée
+ 33 (0)6 00 00 00 00

__________________________________________________
Do You Yahoo!?
En finir avec le spam? Yahoo! Mail vous offre la meilleure protection possible contre les messages non sollicités
http://mail.yahoo.fr Yahoo! Mail

Seuls points positifs de ce mail : il correspond effectivement à mon profil, et en cherchant un peu plus, on peut lui reconnaître d’être rédigé dans un français correct et courtois (quoique la construction de la première phrase est discutable). En dehors de cela, la liste des points négatifs est longue.

Tout d’abord l’utilisation de mon adresse professionnelle est le premier point que je reproche à cette personne : on imagine facilement les complications que cela pourrait entraîner pour un salarié si sa hiérarchie le voyait recevant des mails de proposition d’embauche sur sa boite professionnelle, même s’il n’en est aucunement responsable.

Au delà de l’utilisation de cette adresse, sa seule possession est répréhensible en soit. Je suppose qu’il l’ont simplement obtenue à partir de mon nom, trouvé sur quelque réseau social, et d’autres adresses de leur connaissance. Je serais curieux de savoir ce que la CNIL penserait de la base de données de ces gens et de leurs méthodes pour la constituer.

Ensuite du point de vue du contenu, ce courrier use de malhonnêteté pour tenter d’attirer mon attention, et me prend même pour un idiot : je n’ai en effet jamais eu le moindre contact avec ces gens, si c’était le cas je m’en souviendrais ! À l’attention des éventuels recruteurs curieux de connaître l’impact d’un tel courrier : à ce stade du mail — la première phrase — mon intérêt est déjà nul, et mon attitude commence à virer au mépris. Ce n’est pas prendre un grand risque que de supposer que ce n’était pas vraiment l’effet souhaité par son auteur.

Du point de vue de la forme, ce n’est guère mieux. Le professionnalisme brille par son absence : adresse mail hébergée par Yahoo!, aucune indication sur ne serait-ce que le nom de la société, numéro de téléphone mobile… C’est un florilège, que la publicité en signature ponctue splendidement (les mauvaises langues diront qu’elle est presque à propos :-) ).

Je n’ai jamais donné la moindre suite à ce courrier, préférant en rire avec mes collègues que de répondre par un coup de téléphone fort peu cordial.

…à l’autre…

À l’opposé de cette attitude, j’ai un jour reçu le mail suivant.

proposition d’emploi

Monsieur,

UneBoiteBien est une agence numérique innovante spécialisée dans l’ingénierie de l’image, du multimédia et de la 3D Temps Réel. Nous proposons aux entreprises des outils interactifs pour les forces de vente, des solutions pour les événements, des contenus 3D/Vidéo …

Spécialisé dans la 3D temps réel et la gestion numérique, nous sommes actuellement à la recherche d’un développeur 3D, disponible immédiatement. Nous sommes fortement intéressés par votre curriculum vitae et nous nous permettons de vous joindre pour un éventuel entretien si l’offre vous intéresse cette semaine ou semaine prochaine selon disponibilité. Nous vous transmettons de ce fait, la fiche de poste correspond au travail demandé et espérons vous avoir en ligne très bientôt.

Sincères salutations

Laetitia Douée
Assistante commerciale
tel. 01 00 00 00 00

UneBoiteBien
42 rue UneRue
75042 Paris

Cette fois je commence par les points négatifs. Je suis d’habitude très exigeant concernant l’orthographe, voire le respect des règles de typographie, de tout contact écrit. Un bon usage de la langue est indispensable à une bonne compréhension. Aussi quelques fautes ont généralement vite fait de coûter des points de crédibilité en ce qui me concerne. L’inverse est vrai. Ici une faute d’accord, un pronom oublié, pas de majuscule dans le sujet… ça arrive. Et vient alors la liste des points positifs.

Tout d’abord le ton de ce mail me semble modeste et agréable. Tenir compte des disponibilités de la personne est notamment appréciable. J’ai l’impression d’enfoncer une porte ouverte en écrivant cela, et pourtant, c’est tout de même nettement plus cordial qu’un « Merci de nous contacter si notre proposition vous intéresse », aussi sec que courant. J’ai un jour reçu un mail qui me demandait même de venir le jeudi suivant à 10h si j’étais intéressé (je rappelle au lecteur que je parle ici uniquement de contacts spontanés), auquel je n’ai certainement pas pris la peine de donner la moindre réponse. Que penser d’une entreprise qui se permet de telles d’exigences de personnes n’ayant encore rien à voir avec elle ?!

Tout comme le précédent, la proposition est tout à fait adaptée à mon profil.

Ensuite ce mail est adressé à mon adresse personnelle. Renseignements pris par la suite (curiosité oblige), elle a été obtenue ainsi que le reste des informations me concernant via une recherche sur le web — probablement un bête Google — ayant abouti sur mon CV.

Enfin toutes les informations nécessaires sont évidemment présentes : nom de l’entreprise, présentation succincte de l’activité et contexte, et coordonnées complètes. Je croyais que c’était un minimum, mais il faut manifestement s’attendre à tout. :-)

…le résultat n’est pas le même

En conclusion, il me paraît clair que cette fameuse première impression dont on insiste qu’elle est très importante pour le candidat à un quelconque poste, l’est également pour le recruteur. Car ces derniers ne sont pas les seuls à être critiques et à vouloir travailler avec des professionnels. C’est d’autant plus vrai dans un contexte où la recherche d’emploi ne se porte pas si mal, à comparer à la période 2002 par exemple, où les rapports de force étaient très différents.

Si on met de côté le fait que j’étais déjà employé lorsque j’ai reçu l’un et l’autre de ces courriers, ils étaient tous les deux bien ciblés. Pourtant l’un a reçu une réponse et pas l’autre. Surprenant ?

Anecdotes de la Science – Les prix Nobel de Max von Laue et James Franck

Suite à quelques hypothèses immobilières un peu risquées, l’économie américaine semble s’effondrer, chaque jour est plus historique que le précédent, et la question n’est même plus de savoir quelle grande banque fait faillite aujourd’hui… Pas de panique : en temps de crise économique, l’or est une valeur sûre. Elle a résisté aux grandes crises économiques de l’histoire, et notamment aux deux guerres mondiales. Durant l’occupation Allemande, posséder plus de cinq grammes d’or était d’ailleurs un crime économique. Tout ceci me permet d’arriver à l’histoire des prix Nobel de Max von Laue (1879-1960, Nobel de physique 1914) et James Franck (1882-1964, Nobel de physique 1925). Les médailles de prix Nobel sont en effet frappées en or.

Médaille du prix Nobel

Le chimiste Hongrois George von Hevesy (1885-1966) travaille à l’Institut Niels Bohr au Danemark, lorsqu’en 1940 l’armée Allemande envahit ce pays. Craignant qu’elles ne soient volées par les Nazis, il décide de dissoudre les médailles des prix Nobel de Max von Laue et James Franck grâce à de l’eau régale. Elles seront gardées sous cette forme discrète dans le laboratoire jusqu’à la fin de la guerre. Celle-ci terminée, il fait reprécipiter l’or, à partir duquel la Fondation Nobel refrappe les deux médailles. Entre temps il se voit d’ailleurs à son tour décerner en 1943 le prix Nobel de chimie.

Merci Sly pour m’avoir signalé cette anecdote. :-)

Article « Eau_régale » sur Wikipédia
Article sur l’investissement dans l’or

Petite mise au point

Cela fait un mois que je n’ai rien posté ici ; quelques articles sont pourtant en cours, depuis quelques temps même, et j’ai en tête également d’autres sujets que j’aimerais coucher sur clavier. Seulement récemment je m’autorise à profiter d’un certain manque de temps.

Afin de justifier tout cela, est énoncée la règle suivante : en respect et vertu du titre de cette page, tout ce qui y est posté se doit de l’être avec retard. La lose est un art, et le maîtriser requiert très un grand savoir faire. Le Google Developer Day, et l’excellence de ses organisateurs en la matière, me l’ont encore rappelé récemment. I won’t lose to them!

Google lounge