[Top][All Lists]
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
[sdx-users] UTF-8 sous Linux
From: |
Pierre Dittgen |
Subject: |
[sdx-users] UTF-8 sous Linux |
Date: |
Mon, 10 Nov 2003 11:31:38 +0100 |
User-agent: |
Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.5) Gecko/20031007 |
Bonjour,
Je suis en train de mettre en place une application SDX sous Linux.
J'utilise le JDK 1.4.1, Tomcat 4.1.29 et SDX 2.1 CVS.
La machine est "UTF-8 aware", les différentes tables de caractère sont
installées et je peux manipuler de l'UTF-8 avec d'autres programmes.
Le problème est le suivant : lorsque j'accède à mon application et que
je saisis des chaînes accentuées, je me retrouve avec des caractères
bizzares dans les documents. Le problème ne se pose pas avec des
documents créés ailleurs (sur mon poste WinXP) et importés ensuite sur
la machine.
Je pense avoir mis 'UTF-8' un peu partout où il fallait (web.xml pour le
traitement des formulaires, les différents sitemap.xmap, la variable
d'environnement CATALINA_OPTS avec la valeur -Djava.lang.encoding=UTF-8)
En investigant un peu, j'ai vu que le header HTTP posait problème :
Date: Mon, 10 Nov 2003 12:16:43 GMT
Server: Apache-Coyote/1.1
Content-Type: text/html;charset=ISO-8859-1
Client-Date: Mon, 10 Nov 2003 10:18:32 GMT
Client-Peer: 193.50.232.84:9000
Client-Response-Num: 1
Set-Cookie: JSESSIONID=030298B00AFC80A547916311B99C45AB; Path=/sdx
X-Cocoon-Version: 2.0.4
Vous remarquerez l'indication du charset (ISO-LATIN-1) qui est erroné
(ou du moins pas celui que je souhaite)... Ma page est pourtant
sérialisée en UTF-8 et je précise le codage dans le header HTML mais
c'est le header HTTP qui prime. Je me retrouve avec des caractères
bizarres à la saisie...
Un contournement consiste à forcer l'encodage de la page dans le
navigateur mais ce n'est pas vraiment pratique et en plus ce n'est
valable que pour la page courante :-(
Sous Windows, je n'ai pas ce problème... En examinant le header HTTP sur
ce système, j'obtiens :
Date: Mon, 10 Nov 2003 10:11:40 GMT
Server: Apache Coyote/1.0
Content-Type: text/html
Client-Date: Mon, 10 Nov 2003 10:13:22 GMT
Client-Peer: 192.168.0.16:8080
Client-Response-Num: 1
Client-Transfer-Encoding: chunked
Set-Cookie: JSESSIONID=13D6EC1B5FD97A072288C68E1577A091; Path=/sdx
X-Cocoon-Version: 2.0.4
Cette fois-ci, l'encodage n'est pas précisé ! Du coup, celui donné dans
le header HTML doit être pris en compte.
Savez-vous où quel est le fichier de configuration magique permettant de
modifier (ou supprimer) l'affichage du charset dans le header HTTP
produit par Cocoon ?
Merci d'avance
Pierre
--
Pierre Dittgen, address@hidden
PASS Technologie http://www.pass-tech.fr
- [sdx-users] UTF-8 sous Linux,
Pierre Dittgen <=
- RE : [sdx-users] UTF-8 sous Linux, Martin Sevigny, 2003/11/10
- Re: RE : [sdx-users] UTF-8 sous Linux, Pierrick Brihaye, 2003/11/10
- Re: RE : [sdx-users] UTF-8 sous Linux, Pierre Dittgen, 2003/11/10
- Re: RE : [sdx-users] UTF-8 sous Linux, Pierrick Brihaye, 2003/11/10
- Re: RE : [sdx-users] UTF-8 sous Linux, Pierre Dittgen, 2003/11/10
- Re: RE : [sdx-users] UTF-8 sous Linux, Pierrick Brihaye, 2003/11/10
- Re: RE : [sdx-users] UTF-8 sous Linux, Pierre Dittgen, 2003/11/10
- Re: RE : [sdx-users] UTF-8 sous Linux, Pierrick Brihaye, 2003/11/10
Re: [sdx-users] UTF-8 sous Linux, Pierrick Brihaye, 2003/11/10
Re: [sdx-users] UTF-8 sous Linux, Malo Pichot, 2003/11/10