![]() |
| Home > FAQ on different themes > fr > minis-faqs > |
[Mini-Faq] Le HTML dans les news |
Archive-Name: fr/minis-faqs/html-dans-les-news
Bonjour,
Cette FAQ a été rédigée par Émilie Danna et est désormais mise à
jour par votre serviteur, Julien Lenglet (julienl+faq@teaser.fr).
Pour tout commentaire ou pour signaler une erreur, une coquille,
etc, n'hésitez pas à contacter le mainteneur.
Sommaire
1. Situation actuelle : pas de HTML sur Usenet
2. Les inconvénients du HTML
2.1. Trois fois plus à transporter et à stocker
2.2. L'augmentation de la capacité des disques durs, de la
rapidité des liaisons et du trafic
3. Les avantages supposés du HTML
3.1. Lisibilité
3.2. Les caractères non-latins, les formules mathématiques et
les images
4. Les autres formats
5. Remerciements
1. Situation actuelle : pas de HTML sur Usenet
Le HTML est prohibé dans toutes les chartes des groupes de la
hiérarchie fr. Il est également fortement déconseillé dans tous les
groupes du Big 8 (comp, humanities, misc, news, rec, sci, soc, talk)
ainsi que dans les groupes non-binaires de alt.* et toutes les autres
hiérarchies régionales à ma connaissance. Autrement dit, l'usage du
HTML est autorisé, à ma connaissance, uniquement dans les
pseudo-groupes du pseudo-réseau Niouzenet et dans la hiérarchie
microsoft.*.
Plus efficacement, sur la plupart des serveurs de nouvelles
administrés, tous les articles en HTML ou avec une partie texte et une
partie HTML (multipart/alternative ou multipart/mixed) sont
automatiquement filtrés, c'est-à-dire qu'ils n'apparaissent pas sur le
serveur où le filtre adéquat est en place, mais continuent de se
propager sur les serveurs qui ne filtrent pas. Concrètement, cela
signifie que vos articles ne passent pas sur de nombreux serveurs.
Ce filtrage est possible grâce à cleanfeed, utilisé majoritairement
avec le serveur INN, avec les variables block_html, block_mime_html et
html_allowed.
Ce filtrage est également intégré au serveur DNews:
Dans newsfeeds.conf, mettre dans la section qui concerne le "me" du
feed:
reject article "\ncontent-type: text/html"
reject article "\nContent-Type: multipart/alternative"
Empiriquement, on constate que
reject body "\ncontent-type: text/html"
reject article_header "\ncontent-type: text/html"
est plus efficace.
De plus, tous les lecteurs de nouvelles ne lisent pas le HTML.
Lecteurs qui peuvent afficher directement du HTML: Netscape, Outlook
Express, trn4 (en texte)
Lecteurs qui ne peuvent pas afficher directement du HTML: Gnus, Free
Agent, Agent, slrn, ...
2. Les inconvénients du HTML
2.1. Trois fois plus à transporter et à stocker
Les articles en HTML prennent en moyenne environ 3 fois plus de place
que les mêmes articles en texte brut seulement.
En effet, comme une grande partie des lecteurs de nouvelles ne peuvent
pas afficher le HTML, il faut doubler la contribution en HTML de son
équivalent en texte brut. On obtient ainsi des articles de la
composition suivante:
Dans les en-têtes de l'article:
MIME-Version: 1.0
Content-Type: multipart/alternative;
boundary="----=_tralalalalala"
Et dans le corps de l'article:
Message en plusieurs parties et au format MIME.
----=_tralalalalala
Content-Type: text/plain; charset="iso-8859-1"
Content-Transfer-Encoding: quoted-printable
----=_tralalalalala
Content-Type: text/html; charset="iso-8859-1"
Content-Transfer-Encoding: quoted-printable
----=_tralalalalala--
Comme le texte en HTML prend, à cause des balises approximativement
deux fois plus de place que la même contribution en texte brut, on
obtient en définitive un article 3 fois plus gros.
Ce rapport de 3 à 1 est naturellement une moyenne. Pour un article
court à la mise en page surchargée, il est plus élevé; pour un article
long de type FAQ où seuls les titres des paragraphes sont mis en
valeur, il est moindre.
De plus, l'encodage utilisé par défaut par de tels articles, le
quoted-printable (QP), est lui aussi déconseillé et mal décodé par de
quelques logiciels de lecture de news.
2.2. L'augmentation de la capacité des disques durs, de la rapidité
des liaisons et du trafic
Certes la capacité des disques durs a fortement augmenté, la bande
passante aussi et les modems sont plus rapides, mais:
- Le trafic a aussi augmenté, et ce continûment et beaucoup plus vite
que la rapidité des modems ou la capacité des disques durs. Personne
n'est disposé à augmenter sa facture téléphonique ou à saturer sa LS
ou à acheter continuellement des disques durs de qualité pour le
serveur de news dont il est responsable et pour lequel son budget
est en général réduit. Cette augmentation du trafic a fait
disparaître les "vrais" feeds complets qui demandent trop de
ressources (en décembre 1998: environ 23 Go par jour pour un feed
complet, 14 Mo par jour pour fr). Pour avoir une idée plus précise,
je cherche des chiffres (réels, pas de prévision) sur au moins
quelques mois pour la taille d'un feed (nombre de Mo par jour), mais
uniquement pour des hiérarchies "texte", par exemple le Big 8 ou fr,
ou même alt sans les binaires.
- À la limite, l'augmentation de ressources nécessaire à la
propagation du HTML serait acceptable si le HTML apportait
réellement quelque chose à Usenet, ce qui est faux, comme nous
allons le voir maintenant.
3. Les avantages supposés du HTML
3.1. Lisibilité
Le HTML permet de "mettre en page" le texte, c'est-à-dire de changer
la police, la taille, la couleur du texte, la texture du fond, etc.
Cette possibilité devrait augmenter la libilité des articles,
cependant:
- Le HTML ne permet pas d'entrelacer les citations proprement: il est
incapable de montrer correctement qu'un texte est cité et qu'à
l'intérieur de ce texte cité, un autre texte est cité, etc. Il ne
dispose donc pas d'une fonction essentielle à Usenet où le plus
important pour augmenter la lisibilité est de montrer clairement, par
des couleurs différentes par exemple, qui a écrit quel texte et par
qui il est cité.
- De nombreux lecteurs de nouvelles permettent déjà de distinguer par
des couleurs distinctes les différentes citations, en mettant dans
la même couleur le texte écrit et la ligne d'attribution de ce même
texte, c'est-à-dire la ligne du type « Le 2 Feb 1998, Marcel Dugenou
écrivait: ». Il serait maldroit de critiquer un format (le texte
brut) alors que le responsable de tous vos malheurs est en fait le
logiciel qui exploite mal ce format (par exemple Outlook Express).
- Les couleurs choisies par les intervenants ne sont pas toujours du
meilleur goût et diminuent parfois la lisibilité. Un texte vert sur
un fond rouge est illisible. La balise
| Back to category minis-faqs - Use Smart Search |
| Home - Smart Search - About the project - Feedback |
© allanswers.org | Terms of use