[Top][All Lists]
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
[sdx-users] Documents attachés
From: |
Patrice Pillot |
Subject: |
[sdx-users] Documents attachés |
Date: |
Thu, 11 Dec 2003 09:14:13 +0100 |
User-agent: |
Mutt/1.3.28i |
On Wed, Dec 10, 2003 at 05:02:35PM +0100, Claude NIEDERLENDER wrote:
> Mes documents sont bien indexés dans mon entrepôt de type FS, mais
> mmon fichier attaché image ne l'est apparemment pas.
Ce message de Claude Niederlender (dont je sais qu'il travaille sur
des problèmes plus que similaires aux miens) ravive un questionnement
auquel je n'ai jamais pu apporter de réponses qui me satisfassent
vraiment. Je crois avoir compris (mais est-ce vraiment le cas ?) le
principe de l'indexation conjointe des documents attachés avec les
documents maîtres, mais je suis à peu près sûr de ne pas en percevoir
tous les tenants ni tous les aboutissants.
Je crois voir l'intérêt de l'utilisation des documents attachés dans
le cas de réseaux d'applications comme ceux qui ont été quelquefois
évoqués dans cette liste : une entité nationale possède des
représentations locales qui gèrent chacune des documents XML tous
validés par un même schéma, chaque document XML pouvant posséder un ou
plusieurs documents attachés (XML ou non) ; partant, on peut imaginer
que chaque représentation locale de l'entité nationale développe une
application SDX qui va 1) permettre une exploitation locale
(oserais-je dire "customisée" ?) de la base locale de documents et 2)
servir de "fonds" adventice aux applications SDX développées par les
autres représentations locales. À ce titre, on comprend bien que
l'indexation liée des documents et de leurs documents attachés
permettra aux applications tierces d'exploiter plus facilement les
données d'une base donnée.
Mais je ne perçois pas bien (et c'est ce qui m'inquiète) l'intérêt de
l'utilisation des "documents attachés" dans le cas d'une application
SDX qui ne serait pas intégrée dans un "réseau" tel que celui que j'ai
décrit plus haut. Prenons par exemple le cas qui a été évoqué à
plusieurs reprises dans cette liste d'un journal qui va publier des
articles en ligne. Ce journal, par définition, sera l'entité unique de
diffusion de ces articles puisqu'il possèdera sur eux les droits
éditoriaux. Les articles seront bien sûr validés par un schéma donné
et seront agrémentés par des illustrations contenues dans des fichiers
graphiques. Comme ce journal est à la pointe du progrès, il utilise
SDX. On est tous bien placé pour connaître l'intérêt de la chose. Mais
quel est l'intérêt pour ce journal d'utiliser la technique des
documents attachés pour les illustrations des articles sachant qu'a
priori (mais c'est là que je dois me gou^H^H^H tromper) sa base de
document ne sera pas interrogée par des applications SDX tierces ?
Qu'ajoute la technique des documents attachés par rapport à la seule
utilisation d'URL dans le document lui-même ?
Aux temps glorieux de SDX 1 je ne m'étais pas interrogé très longtemps
sur les conséquences de ce choix, la perspective de stocker des
fichiers binaires dans une base SQL me suffisait pour savoir quelle
approche adopter. Je ne suis plus du tout sûr aujourd'hui de
l'approche à adopter dans le cas évoqué au paragraphe précédent.
Par ailleurs, ne m'étant pas encore sérieusement penché (mea culpa,
mea maxima culpa) sur OAI je suis totalement incapable de mesurer s'il
y aurait {possibilité,intérêt} à échanger des metadonnées non
seulement sur les documents mais sur leurs documents satellites (qui
peuvent être des images, classiquement, mais aussi des documents - au
sens large du terme - exploitables séparément : applets, scènes 3D,
etc.). En d'autres termes, est-il possible de penser qu'avec ses
fonctionnalités OAI, un entrepôt SDX {puisse,ait intérêt à} servir des
metadonnées non seulement sur la base de documents elle-même mais
également sur les documents satellites (qui devraient donc dans ce
cas, j'imagine, être traités comme des documents attachés au sens SDX
du terme).
Si d'augustes lecteurs peuvent éclairer ma lanterne je leur en serais
très reconnaissant ?
Patrice Pillot