sdx-users
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

RE: [sdx-users] [débutant] SDX: getting started


From: Emmanuel Bégué
Subject: RE: [sdx-users] [débutant] SDX: getting started
Date: Wed, 15 Jan 2003 16:49:39 +0100

Bonjour,

Continuant d'explorer SDX, j'essaie d'administrer l'application
sdxworld (apparemment le seul identifiant qui fonctionne est
"admin" avec un mot de passe vierge; tout autre essai, suivi
d'une désinstallation / réinstallation de SDX s'est révélé
infructueux...?).

Mes deux questions:


A - erreur: <<Impossible de déterminer un identifiant pour ce document
(si fournie, URI="file:/C:/_temp/mag/253972.xml") >>

- les documents d'exemple de l'application sdxworld sont des documents
qui décrivent des ressources externes (sites web de catalogues de
ressources culturelles); ces documents contiennent tous un élément
<adresse> qui contient l'url de la ressource dont le document xml
est un résumé; cet élément est semble-t-il utilisé par le processus
d'indexation pour fournir un identifiant au document

- a contrario, les documents que je cherche à indexer sont à eux-mêmes
leur propre référence (des articles de journaux); idéalement je voudrais
construire pour chacun une url qui serait du type
http://serveur/document?docid=identifiant où "identifiant" serait le nom du
fichier

=> l'opération a lieu apparemment dans index-projet.xsl mais je n'en
comprends pas la syntaxe?


B - encoding

- les documents que je cherche à indexer sont encodés en ISO-8859
mais marqués de façon erronée comme UTF-8; pour les tests je peux
faire un rechercher-remplacer; par contre pour la phase de production
il est difficile de le faire (environ 200 000 documents)

=> peut-on indiquer à SDX (SAX?) d'ignorer l'information d'encodage?


---
En vous remerciant,
Cordialement,
EB





reply via email to

[Prev in Thread] Current Thread [Next in Thread]