sdx-users
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[sdx-users] Thesaurus


From: Martin Sevigny
Subject: [sdx-users] Thesaurus
Date: Wed, 12 Feb 2003 07:53:48 +0100

Bonjour,

> Par ailleurs vous parlez dans plusieurs autres messages des 
> "thesaurus" (ri): où puis-je en lire plus? (qu'appelez-vous 
> exactement un thesaurus / comment associe-t-on des mots aux 
> documents / quel est l'état d'avancement du projet, etc.)?

Un thesaurus est un thésaurus qui respecte la norme ISO5964:1985 (voir
par exemple http://www.nlc-bnc.ca/iso/tc46sc9/standard/5964e.htm). Donc
avec des relations "terme générique", "terme spécifique", "terme
associé", "terme rejeté", "note d'application", "terme équivalent",
"terme partiellement équivalent", ces deux dernières concernent les
thésaurus multilingues.

SDX, dans un premier temps, supporte l'utilisation d'un thésaurus pour
les recherches. Ainsi, pour tout type de recherche, on peut demander à
SDX d'utiliser un thésaurus pour "étendre" la recherche (query
expansion), en choisissant les relations que l'on désire suivre (par
exemple "ajouter les génériques" ou "ajouter les spécifiques jusqu'à
deux niveaux en dessous").

SDX permet également de faire une recherche dans un thésaurus, et ainsi
trouver des termes (par exemple pour les présenter à un utilisateur). On
peut également inclure un thésaurus ou un terme de thésaurus dans le
flux SAX (comme un sdx:includeDocument).

On déclare un thésaurus dans le application.xconf. Pour l'instant, le
thésaurus doit être dans un document XML (le schéma, non stable, est en
CVS), SDX se charge lui-même de voir si le document a été modifié depuis
la dernière fois qu'il a été "compilé". Eventuellement, il pourra y
avoir d'autres schémas (le mécanisme de compilation est souple à cet
égard), ou ça pourra être une classe Java.

Tout ceci fonctionne mais est en cours de test et de stabilisation. Nous
prévoyons terminer ces tests au cours des prochains jours. Dans sdxworld
en CVS, il y a déjà un exemple d'utilisation de thésaurus (dictionnaire
bilingue simplifié), mais comme je l'ai écrit nous ne garantissons pas
pour l'instant que les API utilisées seront les bonnes.

Commentaires bienvenus,

Martin Sévigny





reply via email to

[Prev in Thread] Current Thread [Next in Thread]