sdx-users
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

RE: [sdx-users] Indexation word et pdf


From: Emmanuel Bégué
Subject: RE: [sdx-users] Indexation word et pdf
Date: Wed, 21 Jul 2004 07:45:13 +0200

> Sinon, il y a peut-être une autre approche à explorer... Il me semble
> que Lucene (ou un autre projet associé) a des classes pour indexer du
> Word... Donc il doivent avoir du code Java qui extrait du texte...
>
> Mais c'est vague, je me rappelle seulement l'avoir vu passer... Tu peux
> regarder?

Dans la page "Lucene contributions" il y a un seul projet
référencé "RTF->XML->Lucene", de tetrasix.com:
http://jakarta.apache.org/lucene/docs/contributions.html

tetrasix.com appartient à la société (française & parisienne)
Tetrasys, qui est malheureusement en liquidation judiciaire:
http://www.societe.com/cgi-bin/recherche?rncs=380968297&vu=4

Je pense que le produit s'appelait Majix:
http://www.garshol.priv.no/download/xmltools/prod/Majix.html

Il se trouve que j'avais téléchargé ce truc en mars 2001, je
peux te l'envoyer si tu veux...?

Cdt,
EB





reply via email to

[Prev in Thread] Current Thread [Next in Thread]