sdx-users
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[sdx-users] Documents attachés


From: Patrice Pillot
Subject: [sdx-users] Documents attachés
Date: Thu, 11 Dec 2003 09:14:13 +0100
User-agent: Mutt/1.3.28i

On Wed, Dec 10, 2003 at 05:02:35PM +0100, Claude NIEDERLENDER wrote:
> Mes documents sont bien indexés dans mon entrepôt de type FS, mais
> mmon fichier attaché image ne l'est apparemment pas.

Ce message  de Claude Niederlender  (dont je sais qu'il  travaille sur
des problèmes plus que  similaires aux miens) ravive un questionnement
auquel  je n'ai  jamais pu  apporter de  réponses qui  me satisfassent
vraiment. Je  crois avoir compris (mais  est-ce vraiment le  cas ?) le
principe  de l'indexation  conjointe des  documents attachés  avec les
documents maîtres, mais je suis à  peu près sûr de ne pas en percevoir
tous les tenants ni tous les aboutissants.

Je crois  voir l'intérêt de l'utilisation des  documents attachés dans
le cas  de réseaux d'applications  comme ceux qui ont  été quelquefois
évoqués  dans   cette  liste  :  une  entité   nationale  possède  des
représentations  locales qui  gèrent  chacune des  documents XML  tous
validés par un même schéma, chaque document XML pouvant posséder un ou
plusieurs documents attachés (XML ou  non) ; partant, on peut imaginer
que chaque  représentation locale de l'entité  nationale développe une
application  SDX   qui  va   1)  permettre  une   exploitation  locale
(oserais-je dire "customisée" ?) de  la base locale de documents et 2)
servir de  "fonds" adventice aux applications SDX  développées par les
autres  représentations locales.  À  ce titre,  on  comprend bien  que
l'indexation  liée  des  documents  et  de  leurs  documents  attachés
permettra  aux applications  tierces d'exploiter  plus  facilement les
données d'une base donnée.

Mais je ne perçois pas bien  (et c'est ce qui m'inquiète) l'intérêt de
l'utilisation des  "documents attachés" dans le  cas d'une application
SDX qui ne serait pas intégrée dans un "réseau" tel que celui que j'ai
décrit  plus haut.  Prenons par  exemple  le cas  qui a  été évoqué  à
plusieurs reprises  dans cette liste  d'un journal qui va  publier des
articles en ligne. Ce journal, par définition, sera l'entité unique de
diffusion  de ces  articles  puisqu'il possèdera  sur  eux les  droits
éditoriaux. Les articles  seront bien sûr validés par  un schéma donné
et seront agrémentés par des illustrations contenues dans des fichiers
graphiques. Comme  ce journal est à  la pointe du  progrès, il utilise
SDX. On est tous bien placé pour connaître l'intérêt de la chose. Mais
quel  est  l'intérêt  pour  ce  journal d'utiliser  la  technique  des
documents attachés  pour les  illustrations des articles  sachant qu'a
priori (mais  c'est là que  je dois me  gou^H^H^H tromper) sa  base de
document ne  sera pas  interrogée par des  applications SDX  tierces ?
Qu'ajoute la technique  des documents attachés par rapport  à la seule
utilisation d'URL dans le document lui-même ?

Aux temps glorieux de SDX 1 je ne m'étais pas interrogé très longtemps
sur  les conséquences  de  ce  choix, la  perspective  de stocker  des
fichiers binaires  dans une base  SQL me suffisait pour  savoir quelle
approche  adopter.  Je  ne  suis  plus  du  tout  sûr  aujourd'hui  de
l'approche à adopter dans le cas évoqué au paragraphe précédent.

Par ailleurs,  ne m'étant pas  encore sérieusement penché  (mea culpa,
mea maxima culpa) sur OAI je suis totalement incapable de mesurer s'il
y  aurait   {possibilité,intérêt}  à  échanger   des  metadonnées  non
seulement sur  les documents mais sur leurs  documents satellites (qui
peuvent être des images, classiquement,  mais aussi des documents - au
sens large  du terme -  exploitables séparément : applets,  scènes 3D,
etc.).  En d'autres  termes,  est-il possible  de  penser qu'avec  ses
fonctionnalités OAI, un entrepôt SDX {puisse,ait intérêt à} servir des
metadonnées  non seulement  sur la  base de  documents  elle-même mais
également  sur les documents  satellites (qui  devraient donc  dans ce
cas, j'imagine, être traités comme  des documents attachés au sens SDX
du terme).

Si d'augustes lecteurs peuvent éclairer  ma lanterne je leur en serais
très reconnaissant ?

Patrice Pillot




reply via email to

[Prev in Thread] Current Thread [Next in Thread]