sdx-users
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [sdx-users] SDX 2 : thesaurus


From: François Lemoine
Subject: Re: [sdx-users] SDX 2 : thesaurus
Date: Fri, 31 May 2002 09:17:29 +0100

Bonjour,

un avis personnel et non polémique:
- Les relations évoquées en A me paraissent suffisantes
- L'expérience de thésaurus en BU me pousse à deux conclusions: au niveau de l'indexation c'est très lourd pour le personnel car les référentiels sont très volumineux. Cette lourdeur ralenti le travail ce qui n'est pas bon quand on souhaite mettre rapidement des infos à disposition. Deuxièmement, l'avantage d'une indexation du texte intégral est de proposer une indexation plus riche et plus rapide et de supprimer ce travail de catalogage/indexation issu du monde des BDD bibliographiques. Enfin, les utilisateurs ne connaissent pas ou ne sont pas à l'aise avec l'utilisation des référentiels qu'ils n'utilisent quasiment jamais même pour l'interrogation de BDD très bien indexées comme Medline.

Bravo en tout cas pour le travail accompli.

At 08:56 31/05/02 +0200, you wrote:
Bonjour,

Plusieurs d'entre vous savent que SDX 2 pourra utiliser un thésaurus
multilingue pour faire des recherches (en principe) plus intéressantes.
Derrière cette phrase toute simple, plusieurs aspects sont à préciser,
et c'est pourquoi je sollicite la communauté d'utilisateurs SDX pour
avoir leur opinion à ce sujet.

A) Les relations d'un thésaurus

Si on oublie le multilinguisme pour ce premier point, on peut utiliser
la norme ISO 2788 fournit un point de départ intéressant pour définir
les relations possibles (j'utilise les codes anglais mais les termes
français) :

 BT :  terme générique
 NT :  terme spécifique
 RT :  voir aussi
 USE : employer
 UF :  employé pour
 SN :  note explicative

Je pense que ces relations couvrent la majorité des cas. Avez-vous des
thésaurus qui ont d'autres relations? Si oui, lesquelles?

B) Les relations d'un thésaurus multilingue

La norme ISO 5964 fournit un bon point de départ pour les thésaurus
multilingues. Bien entendu, les relations d'un thésaurus unilingue
(point A) sont à conserver, mais d'autres considérations sont ajoutées.

Tout d'abord, cette norme suppose que tous les termes acceptés dans une
langue doivent être associés à un terme dans toutes les autres langues
du thésaurus. Cette condition est intéressante pour la cohérence d'un
vocabulaire multilingue, mais en recherche elle n'est pas nécessaire et
je ne pense pas que cela devrait devenir une règle pour SDX.

Ensuite, même si la norme établit différents niveaux d'équivalence entre
termes de différentes langues, formellement elle n'ajoute qu'une seule
relation (représentée par le symbole '='), soit l'équivalence entre
termes de différentes langues. Je proposerais donc cette nouvelle
relation :

 ET :  terme équivalent dans une autre langue.

C) La représentation d'un thésaurus

Cela fait 20 ans que l'on fait des normes ISO pour des thésaurus, mais
personne n'a jamais normalisé (à l'ISO ou ailleurs) la représentation
informatique d'un thésaurus. Dans la logique SDX, nous aurons besoin de
définir un ou des schémas XML (DTD) pour des thésaurus qui respectent
les concepts ci-dessus. Les suggestions sont bienvenues.

D) L'utilisation d'un thésaurus en recherche

La principale utilité d'un thésaurus dans un outil de recherche consiste
à modifier une requête de recherche exprimée par un utilisateur en y
ajoutant des termes reliés (peu importe la relation), voire en
remplaçant des termes rejetés. Ce sera la principale fonction des
thésaurus dans SDX 2.

Selon moi, on peut effectuer cette opération de deux façons. La première
consiste à présenter à l'utilisateur les termes reliés à ceux exprimés
dans sa recherche pour le laisser choisir ceux qu'il désire vraiment
utiliser. Pour les personnes habituées à Mistral, c'est ce qu'il fait
lorsqu'on coche "Lexique" dans un formulaire de recherche.

La deuxième façon consiste à ne pas retourner les informations issues du
thésaurus à l'utilisateur, mais d'effectuer la recherche modifiée
directement.

Ce serait au concepteur d'application SDX d'offrir la méthode qu'il
désire avec l'interface utilisateur souhaitée.

Peu importe la façon utilisée, il sera possible de préciser la ou les
relations à utiliser pour trouver les termes reliés dans le thésaurus.
Dans le cas des relations d'équivalence linguistiques, il sera aussi
possible de préciser le ou les langues.

E) La consultation d'un thésaurus

Accessoirement, SDX 2 pourrait offrir une interface standardisée pour
naviguer un thésaurus dans une fenêtre HTML. Si vous avez des idées ou
des exemples à fournir, c'est toujours bienvenue.

-----

Je vous invite donc à commenter ce texte, à y indiquer ce qui manque ou
ce que vous aimeriez avoir comme fonctionnalité reliée aux thésaurus
dans SDX 2. C'est le temps de le faire, dans quelques semaines il sera
trop tard.

A bientôt,

Martin Sévigny


_______________________________________________
sdx-users mailing list
address@hidden
http://mail.freesoftware.fsf.org/mailman/listinfo/sdx-users


*********************************
François Lemoine
Informatique Documentaire
Bibliothèque Universitaire de Reims
Rue des Crayères
Moulin de la Housse
BP 1040
51687 REIMS CEDEX 2

address@hidden

Tel : 33 03 26 91 32 98
Fax: 33 03 26 91 83 85
http://www.univ-reims.fr/URCA/BU/




reply via email to

[Prev in Thread] Current Thread [Next in Thread]