4. La recherche des documents d'intérêt juridique sur l'Internet : le World Wide Web et les moteurs de recherche.

Un aspect non négligeable de l'informatique juridique est constitué aujourd'hui par la possibilité de rechercher sur l'Internet les documents d'intérêt juridique contenus dans les innombrables bases de données électroniques du cyber-espace se référant aux systèmes du monde entier.

Internet est un réseau international d'ordinateurs communiquant entre eux grâce à des protocoles d'échanges de données standard. Plus précisément, Internet est un réseau de réseaux : un interréseau. Le mot « Internet » vient de l'anglais « internetwork ». Les différents ordinateurs branchés au réseau Internet peuvent communiquer ensemble de façon transparente pour l'usager, indépendamment des types d'ordinateurs utilisés (Mac, PC, Unix ou autres), mais en utilisant cependant les logiciels appropriés. A l'origine, Internet reliait entre eux les sites informatiques militaires des États-Unis ; elle s'étend aujourd'hui à la grandeur de la planète et à des sites diversifiés : gouvernementaux, de recherche et d'enseignement, d'entreprises publiques ou privées, d'individus, etc. Le réseau continue de croître et de se diversifier chaque jour(17).

Internet est aussi une véritable autoroute électronique ou médium de communication, utilisant les fils téléphoniques, les fibres optiques, les câbles intercontinentaux, les communications par satellite. Elle est gérée par des comités de représentants pour chaque pays. Les gestionnaires d'Internet ne se préoccupent que d'assurer la fonctionnalité du réseau. Le contenu en information des différents fichiers disponibles sur le réseau et leur organisation demeure la responsabilité des sites participants. Enfin, Internet est aussi une véritable bibliothèque virtuelle, où on peut repérer des fichiers informatiques, des textes, des images, des sons, des vidéos et d'autres informations que chaque participant au réseau a bien voulu mettre à la disposition de la communauté des internautes. On peut y trouver des livres, des périodiques, des journaux, des logiciels, des films, tous en format électronique, donc «virtuel»(18).

La fonction la plus importante (et en même temps la plus connue) parmi celles qui caractérisent l'Internet (19) est constituée par le World Wide Web (WWW, aussi appelé W3 ou, encore plus familièrement, le Web). Ce service utilise le protocole HTTP (Hypertext Transfer Protocol) pour l'échange d'information entre le logiciel client, c'est-à-dire le navigateur, et le serveur : il est basé donc sur un gigantesque système d'hypertextes. L'hypertexte est un document composé par plusieurs pages liées entre elles par des liens (en anglais : links) qu'on peut activer tout simplement en cliquant sur un ou plusieurs mots mis en évidence dans le texte de base(20).

Aujourd'hui Internet contient plus que 800 millions de pages web(21). Comment s'orienter à travers cette masse imposante d'informations ? La recherche des documents (y compris, bien entendu, les documents juridiques) peut être effectuée par l'usager à travers un ou plusieurs outils (moteurs, robots ou automates) de recherche, qui sont des sites spécialisés dans le catalogage des millions de pages web qui se trouvent sur le réseau mondial. Il y a d'abord des moteurs « généralistes », dont la « compétence » s'étend sur tout le web(22), et puis d'autres spécialisés par rapport à certaines réalités nationales(23). Afin d'accélérer la recherche et de diminuer les probabilités d'erreurs on peut aussi s'adresser à des outils ou à des pages regroupant à leur fois plusieurs robots (méta-moteurs ou outils de méta-recherche)(24).

Parmi les moteurs spécialisés dans le domaine juridique on pourra mentionner en note quelques-uns des plus importants(25). Là aussi les opérateurs logiques de l'algèbre de Boole jouent un rôle considérable, surtout face à la quantité impressionnante des documents on line. C'est un véritable dommage que chaque moteur suive des règles strictement. personnelles pour la formulation des interrogations, ainsi obligeant les usagers à apprendre, outil par outil, par quels caractères on peut exprimer des règles logiques qui ont pourtant une valeur tout à fait générale(26), ou, en alternative, à s'acheter sur le web des logiciels de gestion des moteurs de recherche(27).
 
 



 

Notes
 

(17) Pour un historique de l'Internet cf. p. ex. : <http://info.isoc.org/guest/zakon/Internet/History/HIT.html>. Des renseignements (en allemand) constamment mis à jour sur la croissance de l'Internet se trouvent à l'adresse suivante : <http://www.nic.de/Netcount/netStatOverview.html>.

 (18) Pour un guide on line de l'Internet en langue française cf. GIRI - Guide d'initiation à la recherche dans Internet, au site suivant : <http://www.bibl.ulaval.ca/vitrine/giri/mod1/1survol.htm>. Pour en équivalent en langue italienne cf. ISTITUTO PER LA DOCUMENTAZIONE GIURIDICA DEL CNR, Guida di Internet. Imparare Internet da Internet, au site suivant : <http://www.idg.fi.cnr.it/ita/internet/internet.htm>. En général sur le thème « juristes et Internet » cf., pour la France, TORTELLO et LOINTIER, Internet pour les juristes, Paris, 1996 ; pour l'Italie BRUGALETTA, Internet per giuristi, Napoli, 1998 ; pour l'Allemagne TIEDEMANN, Internet für Juristen. Eine praxisorientierte Einführung, Darmstadt, 1999.

(19) Sur lesquelles cf. infra, § 8.

(20) Cf. OBERTO, Appunti per un corso di informatica giuridica (A.A. 1998/99), préc., Sect. II.

(21) Cf. infra, note 24.

(22) Cf. p. ex. : <http://www.altavista.digital.com>; <http://www.yahoo.com/>; <http://www.lycos.com/>; <http://www.excite.com/>; <http://guide.infoseek.com/>.

(23) Cf. p. ex., pour la France : <http://www.trouvez.com/>; <http://www.yahoo.fr/>;
<http://www.idf.net/mdr/liste.html>; pour une liste constamment mise à jour de moteurs de recherche francophones cf. le site de IDF.net : <http://www.idf.net/mdr/liste.html> ; pour l'Italie cf. : <http://excite.tin.it>; <http://ragno.plugit.net/>.

(24) Cfr. p. ex. : <http://www.metacrawler.com/>; <http://www.dogpile.com/>; <http://www.metasearch.com/>; <http://home.mcom.com/home/internet-search.html>; <http://www.gohip.com/hipsearch/>; <http://www.adbs.fr/adbs/viepro/sinfoint/lardy/outils.htm> (pour une liste de métamoteurs). Il faudra cependant tenir compte du fait qu'au fur et à mesure que le nombre des pages web augmente, les moteurs de recherche se trouvent de plus en plus en difficulté à indexer le materiel on-line (cf. p. ex. l'article paru dans L'Espresso du 22 juillet 1999, p. 156, selon lequel le nombre des pages web serait de 800 millions, dont seulement la sixième partie serait indexée par les moteurs de recherche). Un rôle de plus en plus important dans le futur de l'internet va être joué par les « agents intelligents » ; il s'agit, plus exactement, de logiciels dont la tâche est celle d'aller rechercher, même lorsque l'opérateur se trouve « off-line » donc débranché de l'Internet, toute information intéressante pour celui-ci. Voici la définition de intelligent agent fournie par la Webopaedia (à l'adresse web <http://webopedia.internet.com/>) : « intelligent agent (Last modified: July 21, 1998). Programs, used extensively on the Web, that perform tasks such as retrieving and delivering information and automating repetitive tasks. More than 50 companies are currently developing intelligent agent software or services, including Firefly and WiseWire. Agents are designed to make computing easier. Currently they are used as Web browsers, news retrieval mechanisms, and shopping assistants. By specifying certain parameters, agents will "search" the Internet and return the results directly back to your PC. Push technology relies on agents to deliver pre-selected information to your desktop. Some intelligent agents are also used as tools to track Web behavior: they can even "watch" as your surf the Net and record how often you visit certain sites. Later, they can be used to automatically download your favorite sites, let you know when your favorite site has been updated, and even tailor specific pages to suit your tastes». L'un des agents intelligents plus connus est Freeagent (à l'adresse web <http://www.forteinc.com/agent/freagent.htm>).

(25) Cf. p. ex. : <http://www.findlaw.com/search/lawcrawler>; <http://www.admi.net/jo/> (spécialisé pour la France) ; <http://www.law.indiana.edu/law/v-lib/lawindex.html>; <http://www.nomade.fr/infoseek/sciences_sociales/sciences_sociales/droit/>; <http://www.timwilson.com/>; <http://www.juriste.gouv.qc.ca/jrech.html>; <http://www.juriste.gouv.qc.ca/jrech.html>; pour deux listes « francophones » d'outils de recherche voir aussi le site :  <http://www.legalis.net/legalnet/recherche.htm> e <http://www.idf.net/mdr/liste.html>.

(26) Pour un tableau comparatif des fonctionalités des principaux moteurs de recherche mondiaux cf. le site suivant : <http://www.abondance.com/outils/comparatif.html>.

(27) Cf. p. ex. les produits commercialisés aux sites suivants : <http://www.bluesquirrel.com>; <http://www.copernic.com/engines/index.html>.
 
  1