DMOZ : un répertoire Web très humain

Un bref historique et une description des principes de fonctionnement du répertoire Web DMOZ (Open Directory Project), un témoignage personnel sur ma participation à ce projet.

DMOZ, ou Open Directory Project, est le plus grand répertoire du Web, construit par des éditeurs humains et bénévoles. Voici des informations sur les origines, les objectifs et le fonctionnement de ce projet auxquelles j’ai ajouté quelques mots sur l’intérêt que je trouve personnellement à y participer.

DMOZ, qu'est-ce que c'est ?

DMOZ, c’est le Directory Mozilla (le répertoire Mozilla), ou Open Directory Project (ODP - projet de répertoire ouvert).

1998-2004 : DMOZ, une idée qui dure

Le projet est né en 1998, pour partie en réaction à l’évolution du World Wide Web.

1998 : plus d'utilisateurs du Web, plus de ressources

En 1998, le nombre d’utilisateurs pouvant se connecter à l’internet et parcourir le Web commence à devenir important. Parallèlement, la quantité d’information disponible devient considérable.

Les outils de recherche se rendent indispensables

Deux grands types d’outils sont déjà incontournables :

  • les moteurs de recherche, qui répondent à des questions (requêtes) formulées par les utilisateurs en leur servant des paquets d’adresses de ressources (pages ou sites Web), puisées dans un index constitué par un ou des robots et ordonnées selon leur pertinence supposée, critère résultant d’un algorithme de classement ;
  • les répertoires ou annuaires Web, proposant des ressources sélectionnées et ordonnées par des évaluateurs humains, qui les organisent en rubriques ou catégories.

Les annuaires Web commerciaux manquent de ressources humaines

À cette époque, le principal répertoire Web est Yahoo!. Dans le modèle de ce répertoire, les évaluateurs humains (les surfeurs) sont en nombre limité, ils sont salariés. Même si on rêve encore aux miracles de la nouvelle économie, pas besoin d’avoir le prix Nobel pour comprendre que les répertoires devront à terme devenir « rentables » : adieu l’objectivité, l’exhaustivité, la fraîcheur, l’accès égal au référencement pour tous les fournisseurs de contenu (il faudra bientôt, presque partout, payer pour être inscrit), bref : adieu la qualité !

DMOZ sollicite les utilisateurs du Web

L’idée de départ de DMOZ est de contourner ces difficultés, de se placer au dessus de toute exigence de rentabilité pour construire le meilleur répertoire, le plus à jour, le plus complet, le plus objectif possible.

Pour y arriver, il faut des ressources humaines : les sites et pages Web ajoutés à ces outils sont évalués et classés par des humains.

Les répertoires « commerciaux » comptent alors sur les revenus publicitaires pour financer l’augmentation de ces ressources humaines, mais ces recettes publicitaires ne sont pas infinies, et plus elles deviennent importantes pour la survie même des outils, plus elles dégradent la qualité du service offert aux utilisateurs, directement (pollution publicitaire), ou indirectement (des répertoires moins objectifs, moins complets, où il faut payer pour entrer).

Les éditeurs DMOZ : des utilisateurs du Web deviennent contributeurs

Il existe un réservoir de ressources humaines infini, ou presque : la communauté des utilisateurs du Web. Ils sont tous compétents dans un domaine, ils ont intérêt à disposer d’outils de qualité, ils peuvent être objectifs et désintéressés : ce sont les meilleurs !

L'idée géniale de Rich Skrenta, le fondateur du projet, est de faire appel à ces utilisateurs pour les transformer en acteurs en leur disant « le Web vous sert, servez vous-aussi le Web ! »

Avec DMOZ, les utilisateurs deviennent des éditeurs (évaluateurs), constituent une communauté, produisent ensemble un travail et offrent, gratuitement, le produit de ce travail à tous les utilisateurs du Web.

De Gnuhoo à DMOZ

Le projet s’appelle d’abord Gnuhoo, puis Newhoo, avant d’être racheté par AOL-Netscape, qui met à sa disposition des personnes salariées, le « staff », pour régler les aspects techniques et piloter la communauté éditoriale. Les idées de départ sont préservées dans ce changement : impartialité, organisation, qualité, fraîcheur.

Le contenu du DMOZ est mis gratuitement à la disposition de tous

Le contenu est toujours disponible « librement » : l’Open Directory Project distribue le contenu du répertoire sous la forme de fichiers mis à jour régulièrement : les sauvegardes RDF. Ce contenu peut être téléchargé et utilisé selon les termes d’une licence proche dans son esprit des démarches de type Open Content (contenu ouvert).

Le fait qu’un opérateur économique alors majeur « s’approprie » le projet ne l’a pas détruit, bien au contraire : il le pérennise, parce qu’il garantit l’infrastructure technique (le système de gestion de DMOZ n’est pas distribué sous licence Open Source contrairement à ce qu’on imagine parfois) en maintenant l'objectif principal : la qualité et la disponibilité du contenu.

Les bénévoles humains le font mieux !

La raison pour laquelle ce cap a été maintenu est simple : dans le projet, le plus important, ce ne sont pas les ressources techniques, ce sont les ressources humaines. Si AOL Netscape avait changé l’esprit du projet, il aurait sans doute perdu une bonne partie des éditeurs bénévoles... Le contrat social marque l'engagement de ce nouveau propriétaire.

DMOZ aujourd'hui : une ressource sans équivalent

Plus de 4 millions de sites Web décrits et classés

Le projet a grossi, grossi... Plus de 60 000 éditeurs bénévoles y ont déjà contribué. Ils viennent de tous les pays du Monde, ils parlent de nombreuses langues, et ont classé près de 4 millions de ressources. Il n’y a pas d’équivalent.

Un annuaire Web spécifique pour les enfants

Un répertoire spécifique donne accès à des ressources soigneusement sélectionnées pour les jeunes et les enfants : Kids and Teens, qui comporte une section en français.

Des sites pour adultes dans un répertoire séparé

Une partie du DMOZ, qui n'est pas accessible depuis les autres sections, accueille les sites pornographiques et autres ressources particulièrement destinées aux personnes majeures : [Note : le lien qui suit conduit vers des pages référençant des contenus à réserver aux adultes] Adult.

Contenu ouvert et gratuit au service des utilisateurs du Web

Le contenu produit par DMOZ est utilisé par de nombreux autres outils, le plus connu étant sans doute Google, qui s’en sert pour constituer son propre répertoire, mais aussi pour améliorer la pertinence des résultats qu’il sert à ses clients-utilisateurs.

Tout ça pose des problèmes, évidemment : penser, c’est classer et organiser, et classer, c’est penser, donc discuter, confronter des points de vue. C’est souvent conflictuel et animé !

Les éditeurs du DMOZ : une communauté de bénévoles active et structurée travaille pour vous

Les directives éditoriales : des règles simples pour la qualité du répertoire

Pour fixer quelques principes et avancer, la communauté des éditeurs bénévoles du DMOZ se réfère à des directives éditoriales. Ces règles simples résultent en général d'un consensus et sont approuvées par le staff. On discute aussi très activement les questions d'organisation du répertoire sur des forums internes réservés aux éditeurs.

Lutter contre les abus : une condition pour rester les meilleurs

Il y a de mauvais joueurs : les sites classés dans le répertoire DMOZ proviennent en partie des recherches des éditeurs qui collectent l’information sur un sujet donné, mais aussi des propositions des utilisateurs. Plus le répertoire a pris de l’importance, et plus il est devenu tentant d’en abuser pour servir ses propres intérêts. Le nombre de façons de le faire est impressionnant, que ces abus viennent des personnes qui possèdent et proposent des sites Web ou d’éditeurs bassement intéressés ou partiaux. Pour traiter les abus, DMOZ s’est, progressivement et en grande partie grâce aux éditeurs compétents dans ce domaine, doté d’outils techniques appropriés, et la possibilité de se spécialiser dans un travail donné (apparition de types d’éditeurs) a été ouverte. Certains types d’éditeurs sont plus attachés à la lutte contre les abus, et accèdent à certains de ces outils spécifiques (ils disposent de privilèges particuliers).

DMOZ connaît-il une crise de croissance passagère ?

Enfin, la taille qu’a atteint le répertoire semble poser des problèmes techniques qui se sont traduits, depuis plus d’un an, par des dysfonctionnements importants : difficultés pour mettre en forme et distribuer le contenu de DMOZ d’abord, mauvais fonctionnement des outils internes et du site public ensuite. Ces problèmes sont maintenant réglés pour une bonne part, mais l’année 2003 a été absolument horrible, et a suscité de nombreuses interrogations du public et des éditeurs sur le devenir du projet.

Devenir éditeur de DMOZ : une expérience personnelle unique

J’ai été attiré par le projet un peu par hasard. Tout le monde est un jour tombé sur ces pages au design un peu vieillot, qui ressemblent à des signets.

On les voit une fois, deux fois, trois fois, et puis on finit par se demander ce que c’est.

« Tiens, ils cherchent des éditeurs ? Moi j’en connais un rayon sur les clous et les boulons, je devrais faire l’affaire ! D’ailleurs, j’ai un site sur les écrous et les boulons, et ils ne l’ont pas répertorié... »

On suit le lien « Devenir éditeur », là, en bas de la page, on remplit un formulaire et, parfois après plusieurs essais, la porte s’ouvre sur une expérience unique.

Chacun y trouve son compte, et les intérêts peuvent changer avec le temps. Ce qui est, à mon avis, extraordinaire, c’est que quelles que soient ses dispositions, on peut toujours y faire quelque chose. C’est aussi une ressource, et être éditeur permet d' apprendre à mieux connaître le répertoire et à y retrouver ce que l’on cherche sur un sujet donné.

C'est une expérience sociale, et l’occasion de découvrir une communauté virtuelle vivante, modérée et structurée. Pour moi, c’est une forme de jeu. Mais certainement pas un jeu de pouvoir. C’est vraiment un point de vue personnel, mais je crois que, si elle n’a pas un fonctionnement exactement démocratique, la communauté éditoriale de l'ODP n’est pas, non plus, une communauté hiérarchisée : les éditeurs n’ont pas autorité les uns sur les autres, ils se spécialisent en fonction de leur expérience, du temps qu’ils ont à consacrer au projet, et de leur intérêt du moment.

Les secrets du cassoul'zilla

C'est un peu comme pour faire un cassoulet : il faut un paysan qui cultive les haricots, un autre qui élève le canard, une personne pour préparer le confit, il faut des casseroles et des gens pour les fabriquer, un cuisinier, etc. Il n’y a pas de hiérarchie entre ces différents acteurs du cassoulet (l’expression est à retenir pour mon prochain bizenesse plan...), et essayez-donc de faire un cassoulet sans haricots et sans casserole, vous m’en direz des nouvelles...

L’expérience est sociale mais virtuelle : elle peut, si on n’y prend pas garde, devenir addictive, comme une drogue. Quand on se fait attraper, ces petits sites qui se promènent sur ces milliers de pages Web finissent par devenir plus importants que la vraie vie réelle (comme la dégustation du cassoulet, par exemple). On s’en sort très bien, on fait une pause et on y retourne différent. Je crois que c’est comme toutes les nouveautés, il y a de l’apprentissage et parfois un peu de casse.

DMOZ, c'est bon, mangez-en : devenez éditeur !

Le seul moyen d’y goûter, à ce drôle de cassoulet, c’est de devenir éditeur...

On peut aussi parcourir le forum public de DMOZ, qui permet de communiquer en direct (et même en français !) avec la communauté éditoriale.

Note : ce texte a été publié une première fois en octobre 2003 sur mon précédent carnet, désormais fermé. Quelques éléments ont été mis à jour.

Haut de page


DMOZ : un répertoire Web très humain, publié pour faire connaître dmoz.

Billets récents pour faire connaître dmoz :

  1. DMOZ : nouveau blog : Bientôt, un nouveau blog sur DMOZ.
  2. Weblogs dans DMOZ : on manque d'éditeurs : On manque d'éditeurs pour classer les blogs dans l'annuaire DMOZ.
  3. Yahoo! aime DMOZ : Pas rancuniers.
  4. Suggérer un Weblog à l'annuaire DMOZ : Conseils pour inscrire son blog dans l'annuaire DMOZ (Open Directory Project).

Regardez ailleurs

Bandeau : Coeurs sur boule

DMOZ : un répertoire Web très humain
6 juin 2004
http://www.azurs.net/mercredi/archives/2004/06/dmoz_un_reperto.html
Mercredi, carnet Web personnel
http://www.azurs.net/mercredi/

© Azurs point net 2004-2005, publié sous licence Creative Commons (http://creativecommons.org/licenses/by-nc-sa/2.0/fr/)