[Top][All Lists]
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
[sdx-users] Thesaurus
From: |
Emmanuel Bégué |
Subject: |
[sdx-users] Thesaurus |
Date: |
Fri, 11 Mar 2005 01:51:03 +0100 |
Bonjour,
La question du jour: comment construire un thesaurus?
Plus précisément, est-ce que le recours à la notion de
"concept" décrite ici
http://www.nongnu.org/sdx/docs/html/doc-sdx2/fr/reference/actions/thesaurus.
html
et qui ressemble plutôt à un identifiant unique, est
obligatoire, ou est-ce qu'on peut écrire un
thesaurus simplement hiérarchique?
Plus précisément encore, supposons qu'on cherche à
écrire un thesaurus de lemmatisation du français (à
partir des bases disponibles sur lexique.org p. ex.)
On veut par exemple que lorsqu'on cherche la forme
conjuguée d'un verbe, l'application cherche toutes
les formes conjuguées de ce verbe; c'est à dire que,
à partir de la forme conjuguée cherchée, l'application
remonte au lemme (dans le cas d'un verbe, l'infinitif)
et "redescend" vers toutes les autres formes conjuguées
de ce verbe, pour les inclure dans la recherche.
C'est exactement le fonctionnement qui est décrit ici:
http://www.nongnu.org/sdx/docs/html/doc-sdx2/fr/indexation/thesaurus.html
(mais on ne montre hélas pas le thesaurus correspondant).
Pour obtenir cela, quelle doit être la forme du
thesaurus? Doit-on construire une relation "est le
lemme de" ou bien "a pour lemme", ou bien les deux?
Autrement dit, doit-on lister:
- chaque terme de bas niveau et en regard le terme de
niveau supérieur auquel il appartient
- ou bien chaque terme de niveau supérieur et pour
chacun, tous les termes de bas niveau qui en dépendent
- ou les deux?
Un exemple serait très intéressant, par exemple qui
correspondrait à la relation
Patrimoine => Architecture => Eglise
qui est décrite dans le lien ci-dessus.
Cdt,
EB
PS: bien sûr, par rapport à ce qui a été dit mardi, ce
thesaurus une fois construit sera à la disposition de
qui veut et/ou de l'ADNX.