sdx-users
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

RE: [sdx-users] Apostrophes et sigles


From: Emmanuel Bégué
Subject: RE: [sdx-users] Apostrophes et sigles
Date: Mon, 3 May 2004 13:25:30 +0200

Bonjour,

Merci de cette réponse.

Effectivement FrenchStandardFilter.java s'occupe, justement,
des apostrophes et des acronymes, mais d'une façon exclusive:
        if (type == APOSTROPHE_TYPE)
                (enlever l'apostrophe en début de chaîne)
        else
        if (type == ACRONYM_TYPE)
                (enlever les points)

donc une chaîne est apparemment d'un seul type, ce qui explique
que "l'O.N.U." ne soit pas traité correctement (il est des deux
types à la fois).

Mais je ne comprends pas quels sont ces types: APOSTROPHE_TYPE
et ACRONYM_TYPE, ni s'il est possible qu'un token appartienne
aux deux types à la fois; autrement dit, suffirait-il de
supprimer le else pour que ça marche?

Cdt,
EB


PS: en attendant, je supprime les points dans la xsl d'indexation;
ça marche, sauf que le hilite ne retrouve plus ses petits et ne
met pas en valeur les acronymes précédés d'un apostrophe (mais ils
sont correctement trouvés).


> -----Message d'origine-----
> De : address@hidden
> [mailto:address@hidden
> De la part de Martin Sevigny
> Envoyé : lundi 3 mai 2004 09:07
> À : address@hidden
> Objet : Re: [sdx-users] Apostrophes et sigles
>
>
> Bonjour,
>
> > La recherche "onu" permet de trouver les documents
> > qui contiennent "O.N.U." mais pas ceux qui contiennent
> > "l'O.N.U." (test confirmé avec de nombreux sigles
> > commençant par une voyelle); pourtant la recherche
> > de mots ordinaires commençant par une voyelle permet
> > bien de trouver ces mots, qu'ils soient ou non précédés
> > d'un "l'" ou d'un "d'".
> >
> > Comment "l'O.N.U." est-il transformé pour son indexation
> > (dans un champ de type word)? Est-ce paramétrable?
>
> C'est le rôle de l'analyseur de mots, utilisé à la fois lors de
> l'indexation et lors de l'analyse de la requête.
>
> C'est paramétrable dans le sens où vous pouvez utiliser l'analyseur que
> vous voulez. Mais les analyseurs fournis ne sont pas paramétrables à ce
> niveau.
>
> Le plus simple est donc d'en créer un nouveau et de l'utiliser. Pour ce
> faire, partir d'un analyseur existant (le plus proche), ils sont dans le
> dossier src/java/fr/gouv/culture/sdx/search/lucene/analysis des sources
> SDX, et faire les modificatins nécessaires.
>
> Si c'est générique, contributions bienvenues ;-)
>
> Martin Sévigny
>
>
>
>
>
> _______________________________________________
> sdx-users mailing list
> address@hidden
> http://mail.nongnu.org/mailman/listinfo/sdx-users
>
>





reply via email to

[Prev in Thread] Current Thread [Next in Thread]