From: Frédéric Glorieux <address@hidden>
Reply-To: address@hidden
To: <address@hidden>
Subject: RE : [sdx-users] Manque de Documentation
Date: Sun, 11 May 2003 10:13:54 +0200
> 1- qu'apport SDX de plus que Lucene en terme d'indexation et de
requête (à
> part thésaurus)
D'abord, un environnement,
- accéder aux résultats directement en XML (XSP+taglib)
- gestion des documents.
- indexation en XSL avec des processus de pipeline
Sur l'indexation elle-même, les champs dates ont été étendus pour les
dates avant 1970. Certaines requêtes ont été affinées. Je laisse à
d'autres d'en préciser plus.
> lister les plus connues types/ procédures d'indexation possibles
> et de voir ce que SDX (en fait Lucene.. hmm) est capable
Pour l'indexation, je comprends mal la question. Cocoon propose
par exemple une implantation de Lucene qui pour chaque nud fait un
champ. Là, on peut peut-être parler d'une manière d'indexer. Pour SDX,
le document d'indexation (<sdx:document id=""><sdx:field ...) résulte
d'une transformation XSL. En conséquence, cela tient à une réflexion
documentaire. Définir le type d'indexation SDX me semble aussi difficile
que de classer toutes les présentations possibles d'un document XML.
On peut tout au plus dégager quelques habitudes communes à
plusieurs applications, et des bonnes pratiques. Exemples de liste de
champs
default, word - champ plein texte par défaut d'indexation mot (type
google)
des champs genre Dublin Core
title word - (pour recherche libre)
title field - (pour tri)
creators word - (auteurs chaînés)
creator field - (chaque auteur, pour tri ou "liens tarzan")
subjects word - (tous les sujets chaînés, pour la recherche libre)
subject field - (chaque sujet, pour tri ou requête exacte)
date date - (création, il existe un champ sdx par défaut pour dernière
indexation)
abstract word - (recherche, et présentation de résultats brefs)
type field - (type de document)
language field -
geo field - (localisation géographique, parfois)