sdx-users
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[sdx-users] gestion des signes diacritiques


From: Pierre . Clavel
Subject: [sdx-users] gestion des signes diacritiques
Date: Thu, 18 Mar 2004 11:18:19 +0100

Bonjour,

SDX, en toute logique, fait en sorte que les accents n'aient pas d'influence
sur l'indexation et la recherche, i.e. 'determine' trouve aussi 'déterminé'.
Nous publions aussi des documents en allemand et, dans cette langue, un
accent requiert un traitement particulier, l'umlaut. D'ailleurs, nous autres
Suisses sommes habitués à ce qu'il soit tenu compte de l'umlaut même dans
les textes en français ou en italien. L'umlaut ne peut apparaître que sur a,
o, et u (ce qui évite une incompatibilité avec le tréma, qui a le même code)
et correspond à un 'e' placé à la suite de la lettre infléchie. 'Böll' doit
donc correspondre à 'Boell' et non à 'Boll', ce qui n'est présentement pas
le cas (bien que la config fasse appel à l'analyseur allemand).

Où se trouvent ces conversions de caractères ?
J'ai bien trouvé un fichier sdx/sdx/resources/js/selects.js avec des lignes
telles que
if ( a==232 || a==233 || a==234 || a==235) a=101;
mais comme les diacritiques n'y sont pas tous traités et que la casse y est
(encore) différenciée, je ne suis pas sûr que ce soit le bon endoit. De
plus, ces commandes ne retournent qu'un code, alors qu'il en faudra deux, du
genre:
if ( a==228) {
a=97;
b=101;
}
...
out += String.fromCharCode(a) [opérateur de concaténation]
String.fromCharCode(b) 

Merci d'avance de votre aide et meilleures salutations
Pierre Clavel
Bibliothèque nationale suisse





reply via email to

[Prev in Thread] Current Thread [Next in Thread]