[sdx-users] best practice

sdx-users

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[sdx-users] best practice - step one !

From:	maisonneuve nico
Subject:	[sdx-users] best practice - step one !
Date:	Sun, 11 May 2003 13:25:02 +0000

From: Frédéric Glorieux <address@hidden>
Reply-To: address@hidden
To: <address@hidden>
Subject: RE : [sdx-users] Manque de Documentation
Date: Sun, 11 May 2003 10:13:54 +0200

> 1- qu'apport SDX de plus que Lucene en terme d'indexation et de
requête (à
> part thésaurus)

D'abord, un environnement,
 - accéder aux résultats directement en XML (XSP+taglib)
 - gestion des documents.
 - indexation en XSL avec des processus de pipeline

Sur l'indexation elle-même, les champs dates ont été étendus pour les
dates avant 1970. Certaines requêtes ont été affinées. Je laisse à
d'autres d'en préciser plus.

> lister les plus connues types/ procédures d'indexation possibles
> et de voir ce que SDX (en fait Lucene.. hmm) est capable

        Pour l'indexation, je comprends mal la question. Cocoon propose
par exemple une implantation de Lucene qui pour chaque nud fait un
champ. Là, on peut peut-être parler d'une manière d'indexer. Pour SDX,
le document d'indexation (<sdx:document id=""><sdx:field ...) résulte
d'une transformation XSL. En conséquence, cela tient à une réflexion
documentaire. Définir le type d'indexation SDX me semble aussi difficile
que de classer toutes les présentations possibles d'un document XML.
        On peut tout au plus dégager quelques habitudes communes à
plusieurs applications, et des bonnes pratiques. Exemples de liste de
champs

default, word - champ plein texte par défaut d'indexation mot (type
google)

    des champs genre Dublin Core

title word - (pour recherche libre)
title field - (pour tri)
creators word - (auteurs chaînés)
creator field - (chaque auteur, pour tri ou "liens tarzan")


liens tarzan ??

subjects word - (tous les sujets chaînés, pour la recherche libre)
subject field - (chaque sujet, pour tri ou requête exacte)
date date - (création, il existe un champ sdx par défaut pour dernière
indexation)
abstract word - (recherche, et présentation de résultats brefs)
type field - (type de document)
language field -
geo field - (localisation géographique, parfois)

ha.. chouette j'ai déjà une réponse à une autre question que je me posais ..pourquoi dans XtoGen(application generant une aap SDX) ,pour un même champs, il y avait 2 champs créer : un field, un word

oui, oui ce côte "best practice" est justement le genre d'info que jerecherche !comme moi, je pense que pas mal de personnes ne sont dans le domainedocumentaire et ce genre d'info, peut-être bidon pour vous, ne le sera paspour nous


nico

_________________________________________________________________

MSN Search, le moteur de recherche qui pense comme vous !http://search.msn.fr/worldwide.asp

[Prev in Thread]

Current Thread

[Next in Thread]

[sdx-users] best practice - step one !, maisonneuve nico <=
- RE : [sdx-users] best practice - step one !, Frédéric Glorieux, 2003/05/11

Prev by Date: [sdx-users] Classification
Next by Date: Re: RE : [sdx-users] proposition du fichieranalysis/fr_extended.xml(liste des mo
Previous by thread: [sdx-users] Classification
Next by thread: RE : [sdx-users] best practice - step one !
Index(es):
- Date
- Thread