sdx-users
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [sdx-users] [débutant] SDX: getting started


From: Pierrick Brihaye
Subject: Re: [sdx-users] [débutant] SDX: getting started
Date: Wed, 15 Jan 2003 18:48:59 +0100

Bonsoir,

>> Si je crée un super-utilisateur autre que admin:blank

Entendons nous sur les termes : un SU *n'est pas* un admin. Un admin a des
droits sur une application ; le SU, sur toutes.

>> il n'est pas autorisé à administrer les applications

CQFD non ? :-)

Mais il est possible qu'il y ait un bug...

> En fait j'essaie d'indexer des documents dans sdxworld, qui donc ne
> respectent pas la DTD "projet.dtd" -- mais SDX ne s'en est pas plaint
> explicitement...?

Mais les logs doivent être très loquaces :-) Normalement, il y a un
processus qui permet d'adopter différents comportements en cas erreur, mais,
dans la config par défaut j'ignore lequel est implanté. En tout état de
cause, le positionnement de votre id de document ne semble pas être bon.
Cela s'explique si vous avez repris la feuille d'indexation telle quelle :

<xsl:template match="/projet">
  <!--  output root element, creates an SDX document with the given @id
attribute  -->
 <sdx:document id="address@hidden">
  ...

L'id ne pourra être positionné que si :
1) vos documents ont un élément de premier niveau nommé "projet"
2) que cet élément a un attribut nommé "id"
3) que vous pouvez garantir que la valeur de cet attribut sera unique dans
votre corpus de documents.

Statistiquement peu probable...

Accessoirement (en l'état actuel des choses), est-ce que vos documents sont
contraints par une DTD ? Si oui, est-elle accessible au contexte SDX ?
Est-ce qu'ils sont bien formés ? Votre question sur l'encodage me laisse un
doute :-)

> Question subsidiaire: j'ai lu dans la doc Lucene que pour réindexer
> un document il fallait le détruire de l'index; comment fonctionne SDX
> du point de vue du réindexage des documents existants

Comme ça : il détruit et recrée. Pour l'instant, il n'y a que des bases de
données Lucene :-)

> > Selon moi, le processus de validation des documents doit se faire en
> > amont, mais bon : on peut toujours discuter :-)
>
> Mon problème c'est que je reçois ces documents en l'état

Contactez le service qualité :-))

> puis-je
> indiquer à SAX/SDX que, de façon générique, les documents marqués comme
> UTF-8 sont en réalité ISO-8859?

C'est normalement faisable : il faudrait positionner le plus en amont
possible du flux un encodage hard-codé, transmis par un paramètre et
remplacer l'encodage figurant dans le prologue XML par le "bon".

A bientôt,

p.b.






reply via email to

[Prev in Thread] Current Thread [Next in Thread]