Dans la peau d'un blogueur influent

Ce week-end j’ai participé à l’organisation de la convention Epitanime 2009, un évènement autour du manga, de l’animation japonaise et de certains aspects de la culture japonaise. Parmi les nombreuses anecdotes qui arrivent nécessairement dans ces cas là (c’est un forfait indivisible :-) ), je me propose de vous raconter celle où j’ai testé pour vous et malgré moi : être dans la peau d’un blogueur influent.

Je ne m’intéresse aucunement aux mangas, mais plus à la culture japonaise en général, ce qui n’est pas vraiment l’objet de cette manifestation. Aussi ce n’est nullement ce qui me pousse à y prendre part. La raison essentielle est simplement que participer à l’organisation d’évènements de cette taille est à la fois très enrichissant et vraiment amusant, bien qu’épuisant. De plus, la motivation et le travail de cette association suffisent à justifier de leur prêter main forte. Voir des gens se bouger pour faire des choses est trop rare pour ne pas être encouragé.

Les moments de calme sont idéaux pour saluer les personnes que l’on n’a pas vu depuis longtemps, ainsi que toute autre forme d’activité sociale. Organisateurs, spectateurs, presse… Amis ou simples visages connus, d’année en année on retrouve des habitués, des vieux même dit-on entre nous, et c’est parfois la seule occasion de l’année de les voir, notamment lorsqu’ils viennent de loin.

Samedi matin, alors que l’activité était encore calme dans la section dont je m’occupais, nous discutions donc avec légèreté (mais par moments aussi, lourdeur :-) ) de choses et d’autres… Tandis que le petit groupe que nous étions débattions de sujets aussi importants que comment chacun allait, le problème de la contrefaçon, ou encore la longueur des jupes, mon interlocuteur me passait sa peluche (ou alors c’est moi qui la lui ai prise, à vrai dire je ne me souviens plus), et je commençais à jouer avec, pour finalement la poser sur mon épaule et continuer à discuter en l’oubliant presque. Un mignon, quoi que poussiéreux, petit raton-laveur, avec comme chaque année ses quatre bracelets d’entrée (deux jours et deux nuits) attachés autour de la queue.

Habillé en Raton
(Merci Noryu pour la photo !)

C’est alors que rentrent deux visiteurs qui s’arrêtent stupéfaits en nous voyant, et s’exclament : « C’est la peluche du raton ? » Et moi de leur répondre « Oui, bien sûr », avec le ton de l’évidence de la personne pour qui cette peluche n’est que celle d’un personnage habituel et même obligatoire de la convention (qui a dit folklore ?). Les deux s’agenouillent alors immédiatement devant moi dans un simulacre d’idolâtrie : « On est… pas dignes ». Moi, avec un ton blasé, pointant le propriétaire de la peluche du doigt : « Raton, c’est lui… ».

Je me demande juste ce qu’a ressenti Raton en se voyant couvrir de fleurs à la troisième personne. :-) En tout cas il avait l’air touché par le discours de ses deux fans, une fois sa personne correctement identifiée. ;-)

WordPress et les captcha

Ce blog qui était épargné jusqu’ici a apparemment été récemment découvert par une machine à spam. Un bot s’entête en effet depuis quelques jours à me dire que mon bref article sur les interfaces du futur est génial, que c’est une bonne idée, qu’il devrait essayer, et autres compliments vides de sens, en anglais évidemment. Avec deux ou trois tentatives quotidiennes, ça reste néanmoins limité, sans commune mesure avec les centaines que des blogs plus importants subissent. Mais en grand fainéant cela suffit à me fatiguer au point de chercher une solution.

Celle qui me vient à l’esprit en premier est l’utilisation d’un captcha. Non pas une image d’un texte vu à travers un fond de bouteille de vodka préalablement vidée, mais juste une question absolument triviale, dont l’effet à déjà fait ses preuves à mes yeux. J’avais en effet déjà implémenté une telle fonction sur le forum de l’ancien site de Prologin avec la question « Combien font deux et deux ? », à laquelle il était possible de répondre en chiffres ou en lettres (ainsi que « 42 », à la demande de quelques candidats). Ce bout de code s’était révélé autrement plus efficace que le module Akismet, à l’effet très discutable, puisque l’on n’avait plus jamais eu le moindre problème depuis lors.

Néanmoins, plutôt que d’aller faire rentrer ça à la hache et au marteau comme précédemment, je me suis dit que quelqu’un avait déjà dû le coder sous forme de module, et qu’une petite recherche serait le plus simple. À défaut de m’avoir encore permis de trouver exactement ce que je cherche, elle aura été très instructive.

Tout d’abord il est partout conseillé d’utiliser Akismet, mais ayant constaté son échec sur le forum de Prologin, c’est la première chose que j’ai désactivée en mettant ce blog en ligne. De plus, sur un site plus important, je ne serais pas surpris que le traitement impliqué ait un coût.

Viennent ensuite les captcha à base d’images brouillées. Cette solution me semble poser quatre gros inconvénients.
Exemple de captcha

  • Tout d’abord elle est pénible : ce type de système me gène en tant qu’utilisateur, et j’imagine que c’est le cas de beaucoup d’autres, même sans aller jusqu’à des extrêmes comme ce grand gagnant (j’ai testé aussi, et je vous recommande de le faire, c’est proprement hallucinant : l’inscription au forum de pompiers.fr). La raison en est simple : il s’agit de chiffres et lettres aléatoires, qui n’ont donc aucun sens, et nécessitent de ce fait une certaine concentration.
  • De plus ces images sont souvent difficilement lisibles, comme le résume très démonstrativement cet article.
  • Ensuite la méthode manque d’accessibilité. Accessibilité, ce n’est pas un mot à la mode à sortir quand on n’a plus d’argument contre des technos qui permettent de faire des sites kikoolol avec des trucs qui clignottent. J’ai un ami qui utilise un clavier braille pour aller sur Internet : pour lui, l’accessibilité, c’est ce qui sépare le net auquel il a accès du reste.
  • Enfin, cette solution s’avère finalement peu efficace face aux progrès de la reconnaissance de forme. En janvier une équipe russe publiait en effet avec fracas un article de recherche traitant de reconnaissance de captcha, et annonçait un taux de réussite de 35% sur les images générées à l’époque par le site Yahoo!, ce qui est amplement suffisant pour en ruiner l’effet. D’ailleurs, sans recourir à ces approches techniques, d’autres spammeurs font lire les images par des utilisateurs en les mettant sur des sites à fort trafic, comme par exemple des sites pornographiques.

Au cours de cette recherche, j’ai également vu passer une méthode à base de son. Cette approche me semble être encore pire que la précédente, aussi je ne vais pas m’étendre plus.

Afin de se débarrasser de la gène occasionnée, certains modules tels que WP Captcha-Free ou WP-SpamFree utilisent le Javascript ou les cookies pour automatiser la reconnaissance du type de visiteur. C’est un moindre mal, mais imposer ces fonctions me gène, toujours pour des raisons d’accessibilité.

Enfin on arrive au méthodes textuelles. Les méthodes dites mathématiques (« arithmétiques » corrigeront les plus rigoureux) semblent être les plus populaires, en témoignent les citations fréquentes de Math Comment Spam Protection Plugin par exemple. Les méthodes textuelles on l’avantage de ne plus poser le problème de l’accessibilité, du moins quand elles restent raisonnables. Le lien que j’ai déjà cité donne quelques exemples d’abus qui en plus d’être tristement risibles, sont parfaitement inefficaces. Reconnaître une expression dans un texte et en retourner le résultat est en effet du domaine du trivial, et demander de calculer la deuxième sur deux ne fait que réduire le taux de réussite d’un bot à 50%. Aussi pénible et peu efficace est remarquable.

À mon avis l’efficacité d’un simple texte pour un captcha réside dans l’analyse sémantique qu’elle nécessite. « Quel fruit pousse sur un pommier ? » est une question simple, ne demandant aucune réflexion, mais qui requiert un traitement du langage qui nous met à l’abri pour cinq à dix ans au moins. WP-Gatekeeper fait partie des modules reposant sur cette technique. N’en ayant pas encore trouvé d’autres de ce genre, mon choix n’est cependant pas encore arrêté. Toute suggestion est d’ailleurs bienvenue. :-)

Pour finir, voici un article en anglais où l’auteur semble avoir constaté lui aussi une grande efficacité pour un bout de code écrit rapidement.

Mais alors qui "died in blogging accident" ?

Vendredi a eu lieu un phénomène tout a fait remarquable sur ce petit monde qu’est le web. L’auteur génialissime du non moins génial quoi que artistiquement très discutable site xkcd a eu l’idée amusante de rechercher le nombre de résultats renvoyés par Google pour une recherche « died in a $danger accident », avec différentes activités plus ou moins dangereuses.

Dangers

Qui ne remarque pas en bas du graphe obtenu ce surprenant « blogging » et ses deux résultats ? Comme tout le monde en voyant ces chiffres, je n’ai pas pu m’empêcher de faire immédiatement la fameuse recherche sur Google, pour trouver, non pas 2, mais environ 350 réponses… Un peu plus tard dans la journée il y en avait déjà 4000, puis un peu plus de 7000 après à peine 24 heures tandis que ce petit phénomène faisait l’objet d’un article dans Slashdot, et maintenant le nombre de résultats dépasse les 50000.

Mais qu’en est-il des deux réponses originales ? La fonction de limitation à des dates de Google étant très pauvre, j’ai d’abord pensé à Exalead… qui s’est avéré être complètement hors circuit avec aucun résultat même sans limitation de date. Toutefois sur Altavista par exemple, on retrouve ces deux liens originaux, qui sont en fait un billet et le lien vers celui-ci sur la page MySpace de son auteur.

Alors je vous donne tout de suite le billet à l’origine bien involontaire de tout ce remue ménage. Le coupable c’est lui :

My dad died in a blogging accident

J’aime beaucoup les commentaires, à commencer par : « This blog is about to skyrocket in views. » :-)

C’était le test consistant à retrouver une aiguille dans une meule de blogs…