sdx-users
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

RE : [sdx-users] Références / Benchmarks?


From: Martin Sevigny
Subject: RE : [sdx-users] Références / Benchmarks?
Date: Mon, 13 Jan 2003 10:18:37 +0100

Bonjour,

> Je suis à la recherche de références concernant SDX:
> quels sites l'utilisent, sur quel volume de documents
> dans la base documentaire, éventuellement avec quelle 
> infrastructure technique?

Il y en a un peu ici : http://sdx.culture.fr/sdx/applications.html, mais
ce n'est pas complet ni à jour.

Nous essayons de profiter de la journée SDX du 30 janvier pour faire un
recensement plus complet. L'application démo de SDX (sdxworld) devait
aussi servir à cette fin.

> En particulier, SDX a-t-il été testé / est-il utilisé
> pour indexer et rechercher une base qui contiendrait
> environ 200 000 documents XML d'une taille de 20 kb
> chacun, soit un volume total d'environ 4 GB?

J'ai déjà indexé 4GB en SDX 1 sur ma machine, pour tester. Un peu long à
indexer mais des temps de recherche ridiculeusement courts ;-) J'avais
fait le test avec des petits et des grands documents. De façon générale,
un seul problème de performance sur de grands index : les listes de
termes des index. Mais nous le corrigerons au cours des prochaines
semaines (dans SDX 2).

Ensuite, je signale que nous sommes en train de reproduire ce genre de
tests, et même de faire une application de test que nous diffuserons
bien sûr. Nous publierons les résultats (avec SDX 2). Nous en parlerons
également lors de la journée du 30 janvier.

Enfin, pour ce qui concerne la performance pure en recherche, on peut
toujours consulter les benchmarks effectués sur Lucene, le moteur de
recherche utilisé par SDX. Et c'est particulièrement convaincant.

Quelques références :

http://jakarta.apache.org/lucene/docs/benchmarks.html
http://nagoya.apache.org/eyebrowse/address@hidden
apache.org&msgNo=3382 (comparaison entre Lucene et Inktomi)

A bientôt,

Martin Sévigny





reply via email to

[Prev in Thread] Current Thread [Next in Thread]