sdx-users
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

RE : RE : [sdx-users] Références / Benchmarks?


From: Martin Sevigny
Subject: RE : RE : [sdx-users] Références / Benchmarks?
Date: Tue, 14 Jan 2003 10:49:08 +0100

Bonjour,

> Merci de cette réponse.
> Pour info, quel était le temps d'indexation de 4 GB en SDX1 
> (sur quelle machine)?

Vague souvenir. Quelque chose comme une quarantaine d'heures. Mais ça
peut tellement varier en fonction du type d'indexation. Et surtout SDX 2
permet d'optimiser.

> J'ai lu quelque part que Lucene était capable d'indexer 200 
> MB à l'heure sur un pentium II, ce qui donnerait 20 heures 
> pour 4 GB: confirmez-vous cette information?

Impossible à confirmer/infirmer, ça dépend du nombre de champs, de leur
type, de l'analyseur utilisé, etc.

Par ailleurs, SDX sera toujours au moins un peu plus lent à indexer que
Lucene seul, parce que le processus d'indexation passe par une (ou
plusieurs si nécessaires) étapes de transformation XML, alors que Lucene
parse directement le HTML (du moins dans sa version de base).

A bientôt,

Martin Sévigny





reply via email to

[Prev in Thread] Current Thread [Next in Thread]