Un bref historique et une description des principes de fonctionnement du répertoire Web DMOZ (Open Directory Project), un témoignage personnel sur ma participation à ce projet.
DMOZ, ou Open Directory Project, est le plus grand répertoire du Web, construit par des éditeurs humains et bénévoles. Voici des informations sur les origines, les objectifs et le fonctionnement de ce projet auxquelles j’ai ajouté quelques mots sur l’intérêt que je trouve personnellement à y participer.
DMOZ, c’est le Directory Mozilla (le répertoire Mozilla), ou Open Directory Project (ODP - projet de répertoire ouvert).
Le projet est né en 1998, pour partie en réaction à l’évolution du World Wide Web.
En 1998, le nombre d’utilisateurs pouvant se connecter à l’internet et parcourir le Web commence à devenir important. Parallèlement, la quantité d’information disponible devient considérable.
Deux grands types d’outils sont déjà incontournables :
À cette époque, le principal répertoire Web est Yahoo!. Dans le modèle de ce répertoire, les évaluateurs humains (les surfeurs) sont en nombre limité, ils sont salariés. Même si on rêve encore aux miracles de la nouvelle économie, pas besoin d’avoir le prix Nobel pour comprendre que les répertoires devront à terme devenir « rentables » : adieu l’objectivité, l’exhaustivité, la fraîcheur, l’accès égal au référencement pour tous les fournisseurs de contenu (il faudra bientôt, presque partout, payer pour être inscrit), bref : adieu la qualité !
L’idée de départ de DMOZ est de contourner ces difficultés, de se placer au dessus de toute exigence de rentabilité pour construire le meilleur répertoire, le plus à jour, le plus complet, le plus objectif possible.
Pour y arriver, il faut des ressources humaines : les sites et pages Web ajoutés à ces outils sont évalués et classés par des humains.
Les répertoires « commerciaux » comptent alors sur les revenus publicitaires pour financer l’augmentation de ces ressources humaines, mais ces recettes publicitaires ne sont pas infinies, et plus elles deviennent importantes pour la survie même des outils, plus elles dégradent la qualité du service offert aux utilisateurs, directement (pollution publicitaire), ou indirectement (des répertoires moins objectifs, moins complets, où il faut payer pour entrer).
Il existe un réservoir de ressources humaines infini, ou presque : la communauté des utilisateurs du Web. Ils sont tous compétents dans un domaine, ils ont intérêt à disposer d’outils de qualité, ils peuvent être objectifs et désintéressés : ce sont les meilleurs !
L'idée géniale de Rich Skrenta, le fondateur du projet, est de faire appel à ces utilisateurs pour les transformer en acteurs en leur disant « le Web vous sert, servez vous-aussi le Web ! »
Avec DMOZ, les utilisateurs deviennent des éditeurs (évaluateurs), constituent une communauté, produisent ensemble un travail et offrent, gratuitement, le produit de ce travail à tous les utilisateurs du Web.
Le projet s’appelle d’abord Gnuhoo, puis Newhoo, avant d’être racheté par AOL-Netscape, qui met à sa disposition des personnes salariées, le « staff », pour régler les aspects techniques et piloter la communauté éditoriale. Les idées de départ sont préservées dans ce changement : impartialité, organisation, qualité, fraîcheur.
Le contenu est toujours disponible « librement » : l’Open Directory Project distribue le contenu du répertoire sous la forme de fichiers mis à jour régulièrement : les sauvegardes RDF. Ce contenu peut être téléchargé et utilisé selon les termes d’une licence proche dans son esprit des démarches de type Open Content (contenu ouvert).
Le fait qu’un opérateur économique alors majeur « s’approprie » le projet ne l’a pas détruit, bien au contraire : il le pérennise, parce qu’il garantit l’infrastructure technique (le système de gestion de DMOZ n’est pas distribué sous licence Open Source contrairement à ce qu’on imagine parfois) en maintenant l'objectif principal : la qualité et la disponibilité du contenu.
La raison pour laquelle ce cap a été maintenu est simple : dans le projet, le plus important, ce ne sont pas les ressources techniques, ce sont les ressources humaines. Si AOL Netscape avait changé l’esprit du projet, il aurait sans doute perdu une bonne partie des éditeurs bénévoles... Le contrat social marque l'engagement de ce nouveau propriétaire.
Le projet a grossi, grossi... Plus de 60 000 éditeurs bénévoles y ont déjà contribué. Ils viennent de tous les pays du Monde, ils parlent de nombreuses langues, et ont classé près de 4 millions de ressources. Il n’y a pas d’équivalent.
Un répertoire spécifique donne accès à des ressources soigneusement sélectionnées pour les jeunes et les enfants : Kids and Teens, qui comporte une section en français.
Une partie du DMOZ, qui n'est pas accessible depuis les autres sections, accueille les sites pornographiques et autres ressources particulièrement destinées aux personnes majeures : [Note : le lien qui suit conduit vers des pages référençant des contenus à réserver aux adultes] Adult.
Le contenu produit par DMOZ est utilisé par de nombreux autres outils, le plus connu étant sans doute Google, qui s’en sert pour constituer son propre répertoire, mais aussi pour améliorer la pertinence des résultats qu’il sert à ses clients-utilisateurs.
Tout ça pose des problèmes, évidemment : penser, c’est classer et organiser, et classer, c’est penser, donc discuter, confronter des points de vue. C’est souvent conflictuel et animé !
Pour fixer quelques principes et avancer, la communauté des éditeurs bénévoles du DMOZ se réfère à des directives éditoriales. Ces règles simples résultent en général d'un consensus et sont approuvées par le staff. On discute aussi très activement les questions d'organisation du répertoire sur des forums internes réservés aux éditeurs.
Il y a de mauvais joueurs : les sites classés dans le répertoire DMOZ proviennent en partie des recherches des éditeurs qui collectent l’information sur un sujet donné, mais aussi des propositions des utilisateurs. Plus le répertoire a pris de l’importance, et plus il est devenu tentant d’en abuser pour servir ses propres intérêts. Le nombre de façons de le faire est impressionnant, que ces abus viennent des personnes qui possèdent et proposent des sites Web ou d’éditeurs bassement intéressés ou partiaux. Pour traiter les abus, DMOZ s’est, progressivement et en grande partie grâce aux éditeurs compétents dans ce domaine, doté d’outils techniques appropriés, et la possibilité de se spécialiser dans un travail donné (apparition de types d’éditeurs) a été ouverte. Certains types d’éditeurs sont plus attachés à la lutte contre les abus, et accèdent à certains de ces outils spécifiques (ils disposent de privilèges particuliers).
Enfin, la taille qu’a atteint le répertoire semble poser des problèmes techniques qui se sont traduits, depuis plus d’un an, par des dysfonctionnements importants : difficultés pour mettre en forme et distribuer le contenu de DMOZ d’abord, mauvais fonctionnement des outils internes et du site public ensuite. Ces problèmes sont maintenant réglés pour une bonne part, mais l’année 2003 a été absolument horrible, et a suscité de nombreuses interrogations du public et des éditeurs sur le devenir du projet.
J’ai été attiré par le projet un peu par hasard. Tout le monde est un jour tombé sur ces pages au design un peu vieillot, qui ressemblent à des signets.
On les voit une fois, deux fois, trois fois, et puis on finit par se demander ce que c’est.
« Tiens, ils cherchent des éditeurs ? Moi j’en connais un rayon sur les clous et les boulons, je devrais faire l’affaire ! D’ailleurs, j’ai un site sur les écrous et les boulons, et ils ne l’ont pas répertorié... »
On suit le lien « Devenir éditeur », là, en bas de la page, on remplit un formulaire et, parfois après plusieurs essais, la porte s’ouvre sur une expérience unique.
Chacun y trouve son compte, et les intérêts peuvent changer avec le temps. Ce qui est, à mon avis, extraordinaire, c’est que quelles que soient ses dispositions, on peut toujours y faire quelque chose. C’est aussi une ressource, et être éditeur permet d' apprendre à mieux connaître le répertoire et à y retrouver ce que l’on cherche sur un sujet donné.
C'est une expérience sociale, et l’occasion de découvrir une communauté virtuelle vivante, modérée et structurée. Pour moi, c’est une forme de jeu. Mais certainement pas un jeu de pouvoir. C’est vraiment un point de vue personnel, mais je crois que, si elle n’a pas un fonctionnement exactement démocratique, la communauté éditoriale de l'ODP n’est pas, non plus, une communauté hiérarchisée : les éditeurs n’ont pas autorité les uns sur les autres, ils se spécialisent en fonction de leur expérience, du temps qu’ils ont à consacrer au projet, et de leur intérêt du moment.
C'est un peu comme pour faire un cassoulet : il faut un paysan qui cultive les haricots, un autre qui élève le canard, une personne pour préparer le confit, il faut des casseroles et des gens pour les fabriquer, un cuisinier, etc. Il n’y a pas de hiérarchie entre ces différents acteurs du cassoulet (l’expression est à retenir pour mon prochain bizenesse plan...), et essayez-donc de faire un cassoulet sans haricots et sans casserole, vous m’en direz des nouvelles...
L’expérience est sociale mais virtuelle : elle peut, si on n’y prend pas garde, devenir addictive, comme une drogue. Quand on se fait attraper, ces petits sites qui se promènent sur ces milliers de pages Web finissent par devenir plus importants que la vraie vie réelle (comme la dégustation du cassoulet, par exemple). On s’en sort très bien, on fait une pause et on y retourne différent. Je crois que c’est comme toutes les nouveautés, il y a de l’apprentissage et parfois un peu de casse.
Le seul moyen d’y goûter, à ce drôle de cassoulet, c’est de devenir éditeur...
On peut aussi parcourir le forum public de DMOZ, qui permet de communiquer en direct (et même en français !) avec la communauté éditoriale.
Note : ce texte a été publié une première fois en octobre 2003 sur mon précédent carnet, désormais fermé. Quelques éléments ont été mis à jour.
DMOZ : un répertoire Web très humain, publié pour faire connaître dmoz.
Billets récents pour faire connaître dmoz :
DMOZ : un répertoire Web très humain
6 juin 2004
http://www.azurs.net/mercredi/archives/2004/06/dmoz_un_reperto.html
Mercredi, carnet Web personnel
http://www.azurs.net/mercredi/
© Azurs point net 2004-2005, publié sous licence Creative Commons (http://creativecommons.org/licenses/by-nc-sa/2.0/fr/)