po4a-dev
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [Po4a-dev]Assainir les encodages ; assainir les options des binaires


From: Denis Barbier
Subject: Re: [Po4a-dev]Assainir les encodages ; assainir les options des binaires
Date: Wed, 15 Jan 2003 17:48:15 +0100
User-agent: Mutt/1.3.28i

On Wed, Jan 15, 2003 at 04:53:35PM +0100, Martin Quinson wrote:
[...]
> Une autre question, c'est comment le programme man va "deviner" le charset ?

Pour l'instant, je n'en sais rien, j'ai vu cette info sur une liste
debian au sujet du futur groff 2.0

Pour POD, j'ai trouvé cette page :
  http://archive.develooper.com/address@hidden/msg00359.html
Seul l'ASCII est autorisé, tout le reste doit être sous la forme E<>.

[...]
> Mmm. C'est dur de convertir ? J'aimerais forcer l'utilisateur à me donner le
> charset en entrée, et lui permettre de donner n'importe quoi en sortie (avec
> par défaut le charset du fichier po)

Non, c'est trivial :
  iconv -f iso-8859-1 -t utf-8 < filein > fileout

[...]
> Ah, on est d'accord. Mais ceci dit, il faut fournir cette information au
> format généré. Je veux dire, si on écrit du XML, il faut pas mettre ceci en
> commentaire, mais à la place prévue pour ca, afin que les outils qui vont
> mouliner ce XML apres nous sachent l'encodage.

Oui, c'est pourquoi l'encoding doit être gêré par po4a, et pas par une
surcouche.

[...]
> Pourquoi ne pas le passer en argument ?
> 
> po4a-gettextize --master-charset=ascii --trans-charset=iso8859-1 man.1 
> man.fr.1

Parce que ça oblige le développeur à se poser des questions. Il y a des
mecs qui arrivent à faire n'importe quoi avec po-debconf (#175024),
si en plus ils doivent mettre les bonnes options, c'est mal barré.

Comme po4a-gettextize est utilisé par le traducteur sur une seule langue,
on peut espérer ne pas avoir ce problème.
Pour po4a-translate, ça me parait vachement moins clair. C'est le
développeur qui va lancer cette commande, s'il a des options à passer,
c'est clair que ça va être n'importe quoi.

Tu peux essayer avec le debian/rules de po4a pour voir ce que ça donne ?

> Je pense nettoyer les options des binaires, et virer les --input et --output
> qui changent de sens avec le programme pour mettre les memes optiosn
> partout. Par exemple:
> 
>  -m,--master : document original
>  -M,--master-charset
>  -t,--trans : document traduit [si t'as un meilleur nom, je suis preneur]
>  -T,--trans-charset
>  -p,--po : po (utilisé en entrée et en sortie)
>  -a,--addendum:
>  -A,--addendum-charset

On peut supposer que les addenda sont dans le mêne charset que le PO.
Le traducteur ne va pas s'amuser à avoir des charsets différents dans
ses fichiers.

> Ce que ca ne permet pas de faire, c'est joindre des pages man originales
> encodées UTF8 et d'autres encodées ASCII dans le meme appel à po4a-updatepo.
> Est ce grave ?

Je ne comprends pas. Dans le fichier PO, il ne doit y avoir qu'un seul codage.

> > > Autre chose, ca va semer la zone dans mes expressions régulières dans le
> > > source, ou il faudrait principalement faire un use UFT8; et eviter deux
> > > trois constructions ?
> > 
> > A priori, tu n'utilises pas 'use locale', donc les expressions régulières
> > ne concernent que l'ASCII et ne sont pas impactées.
> 
> Donc, si je cole use UTF8; ca marche meme pour les caractères multibytes ?

Heu, mais tu n'utilises que de l'ASCII dans tes expressions régulières,
il n'y a donc pas de problème de locales.

> Une autre chose que j'aimerais voir avant de faire une release 1.0, c'est
> permettre de coller les addendums dans les fichiers po, sous forme de
> commentaires ayant un entete particulier (pour packer tous les éléments
> d'une langue donnée dans un seul fichier, et éviter que le mainteneur puisse
> oublier un addendum lors de la génération).
> 
> Mais est ce que l'encodage des commentaires est déterminé ?

Obligatoirement le même que le reste du PO, sinon c'est la fin du monde.

Denis




reply via email to

[Prev in Thread] Current Thread [Next in Thread]