[Top][All Lists]
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
RE : [sdx-users] indexation et controle de l'index pa r un lexique ou u
From: |
Martin Sevigny |
Subject: |
RE : [sdx-users] indexation et controle de l'index pa r un lexique ou un thésaurus |
Date: |
Mon, 12 May 2003 07:14:11 +0200 |
Bonjour,
> d'après ce que j'ai lu sur l'implémentation du thésaurus dans
> SDX, il est
> possible d'étendre les données indexées ou la requete avec
> des mots du
> thésaurus.
Oui. Une documentation plus complète sera d'ailleurs disponible d'ici
une ou deux semaines.
> Est-il possible de contrôler les mots indexés en les limitant à ceux
> présents dans un lexique ou un thésaurus.. ceci afin de
> garder une certain
> qualité de l'index.. ? (en fait c'est l'inverse d'une stop-list, une
> allow-list)
Non, SDX ne fait pas ça lui-même, mais c'est relativement facile à
faire.
N'oubliez pas que lors de l'indexation, vous avez un langage de
programmation (XSLT, Java) à votre disposition. Par exemple, si vous
avez un thésaurus en XML, vous pouvez très bien le charger lors de
l'indexation (<xsl:variable name="th"
select="document('thesaurus.xml')/*"/> et "chercher" à l'intérieur du
thésaurus vos mots.
Si vous êtes inquiet des performances et que vous l'avez à quelque part
sur un serveur, vous pouvez également y accéder par des extensions Java
en XSLT ou en faisant une transformation en Java (au lieu de XSLT) dans
votre pipeline d'indexation.
A bientôt,
Martin Sévigny