Re: [sdx-users] Problème indexation

sdx-users

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [sdx-users] Problème indexation

From:	Martin Sevigny
Subject:	Re: [sdx-users] Problème indexation
Date:	Wed, 06 Oct 2004 11:27:55 +0200
User-agent:	Mozilla Thunderbird 0.6 (Windows/20040502)

Bonjour,

Mes document sont de petits fichiers XML variant entre 1k et 4k....Cequi semble être le problème, c'est que j'en ai 13 000.

Pour en rassurer certains, 13000 c'est _très peu_. Par exemple, on en aindexé 9 millions de tels petits documents récemment.

Mon problème est simple, je lance l'indexation de ma base de document,ça roule pendant un certain temps (15 min environ) et ensuite plus rien.


Plus rien dans le navigateur... timeout...

En fouillant sur les archives de sdx-users, j'ai trouvé ce "thread":http://lists.gnu.org/archive/html/sdx-users/2003-10/msg00044.html
Il semble faire référence au même problème que j'ai... Je suspectais unproblème de "timeout" de session, il semble que ce soit le cas.

Ce n'est pas un timeout de session comme tel, mais un timeout dunavigateur, qui attends 15 minutes (par exemple, je pense que c'est ledéfaut de IE) et s'il ne reçoit rien il abandonne...

Pour t'en convaincre, essaie avec Firefox (Mozilla), le timeout estnettement plus long... En plus des autres bénéfices bien sûr ;-)

Dans les réponses, on fait mention d'une "indexation off-line", est-ceque quelque chose a été fait en ce sens... C'était sur une ancienneversion de SDX.


Non, rien de neuf là-dessus.

Mais, même si le navigateur Web en a marre, l'indexation se poursuitderrière! Donc normalement les 13000 documents sont indexés, non?

Quelque'un a des conseils/solutions?

Aussi, j'ajouterais un un attribut batch="10000" dans l'élément<sdx:uploadDocuments/> ou l'équivalent, si ce n'est fait.

La valeur par défaut est de 25, l'index est optimisé à tous les 25documents, ce qui est ridicule pour de si petits documents.

Ca devrait changer radicalement les temps d'indexation, si ce n'est déjàfait. Ca prend plus de mémoire, mais ça devrait aller.

Si quelqu'un a déjà un roue qui permet l'indexation "off-line", je suispreneur :) J'aime pas ré-inventé l'instrument!Sinon, est-ce que ça vous semble possible de faire un petit programmeJava qui ferait l'indexation? Ici, par contre, j'ignore comment fairepour s'assurer que mon programme puisse passer/utiliser le contexte demon application SDX (config etc) aux classes SDX d'indexation.

Le plus simple c'est de faire un appel d'URL, inutile de passer par duJava. Par exemple un wget bien paramétré en Linux devrait le faire.

Mais encore une fois, 13000 petits documents avec un batch approprié, cen'est pas beaucoup, et sûrement pas assez pour décourager le timeout deFirefox, c'est du moins mon expérience.


A bientôt,

Martin Sévigny

[Prev in Thread]

Current Thread

[Next in Thread]

[sdx-users] Problème indexation, Castonguay Dave, 2004/10/05
- Re: [sdx-users] Problème indexation, Martin Sevigny <=
  - RE: [sdx-users] Problème indexation, Emmanuel Bégué, 2004/10/06
- RE: [sdx-users] Problème indexation, Castonguay Dave, 2004/10/06
  - Re: [sdx-users] Problème indexation, Martin Sevigny, 2004/10/11
- RE: [sdx-users] Problème indexation, Andre . Davignon, 2004/10/12
  - Re: [sdx-users] Problème indexation, Martin Sevigny, 2004/10/12
- RE: [sdx-users] Problème indexation, Andre . Davignon, 2004/10/12
  - Re: [sdx-users] Problème indexation, Martin Sevigny, 2004/10/12
- RE: [sdx-users] Problème indexation, Andre . Davignon, 2004/10/12
- RE: [sdx-users] Problème indexation, Andre . Davignon, 2004/10/13
  - Re: [sdx-users] Problème indexation, Martin Sevigny, 2004/10/14

Prev by Date: [sdx-users] Problème indexation
Next by Date: RE: [sdx-users] Problème indexation
Previous by thread: [sdx-users] Problème indexation
Next by thread: RE: [sdx-users] Problème indexation
Index(es):
- Date
- Thread