Marc Blanchet
Viagénie
inc.
Version 1.2 (févrer 2018) retouchée par
Claude Brière de L'Isle
5. Principales normes reliées à la francisation et l'internationalisation
Ce rapport tente d'orienter le lecteur
sur les principales normes de l'Internet reliées à la
francisation. Celles-ci sont homologuées par l'équipe
d'ingénieriede l'Internet (IETF, Internet Engineering Task
Force) décrit dans les premiers chapitres. Il faut comprendre
que dans le cadre de l'IETF, il n'y a pas de travaux spécifiques
reliés à la francisation, mais plutôt sur la
problématique de l'internationalisation dans son ensemble.
Ainsi, nous utiliserons le mot "internationalisation" dans
le contexte général et le mot "francisation"
lorsque le sujet est spécifique à la francisation.
Selon la terminologie généralement acceptée,
une "norme" est issue d'un organisme de normalisation
reconnu, alors qu'un "standard" désigne une
spécification généralement acceptée dans
l'industrie, mais ne venant pas d'un organisme de normalisation
reconnu. Il est aussi généralement reconnu que l'IETF
joue un rôle d'organisme de normalisation, malgré un
historique et un mode de fonctionnement différent des autres
organismes "traditionnels" de normalisation. En ce sens,
nous avons utilisé le terme "norme" dans ce
document.
Dans les chapitres suivants, les normes sont
décrites selon un regroupement par protocole ou service
Internet.
Dans tout le document, les organismes de
normalisation et de standardisation autre que l'IETF sont mentionnés
lorsque leur rôle nous semble important.
Nous y avons
répertorié des sources d'informations sur le sujet de
la normalisation et formulé des recommandations pour
l'industrie du logiciel de langue française.
Puisque
les normes changent à un rythme très rapide à
l'IETF, ce document deviendra désuet ou tout au moins
incomplet. Nous avons tenté dans un chapitre spécifique
de donner quelques pistes de solution permettant au lecteur de le
remettre à jour. Ce document reflète l'état de
la situation en janvier 1998.
Le processus de normalisation des protocoles sur Internet est une activité de l'Internet Society. Cet organisme est une association à but non-lucratif qui assure au nom des internautes les orientations de l'Internet.
L'Internet Society délègue à l'Internet Architecture Board (IAB) et à l'Internet Engineering Steering Group (IESG) le processus de normalisation des protocoles. Ces deux organismes regroupent environ 10 personnes chacun, bénévoles et élus. Ces deux organismes dirigent les travaux de l'IETF (Internet Engineering Task Force)[1], celui-ci constituant le regroupement de tous les bénévoles impliqués dans la normalisation des protocoles. Il fonctionne par des groupes de travail[2] formés avec un objectif précis. Lorsque les travaux d'un groupe sont terminés, celui-ci est aboli. En ce sens, les groupes de travail apparaissent et disparaissent régulièrement. Les groupes de travail sont regroupés par domaine d'application. Il existe présentement huit domaines: "Applications Area" , "General Area", "Internet Area", "Operations and Management Area", "Routing Area", "Security Area", "Transport Area", "User Services Area". Chaque domaine d'application est supervisé par un ou plusieurs responsables. Avec le président de l'IETF, ceux-ci forment l'IESG.
Il n'y a pas d'affiliation ("membership") ou de représentation nationale à l'IETF. Chaque personne y participe en son nom personnel. Cependant, l'affiliation corporative peut jouer une certaine influence, mais les facteurs les plus déterminants d'influence sont la crédibilité, la compétence et la qualité des propositions permettant de résoudre une problématique bien identifiée.
Il n'y a pas de processus de votation sur les normes à l'IETF. David Clark de MIT a bien résumé le credo de l'IETF de la manière suivante: "Rough concensus and running code". Ce credo, maintes fois répété, confirme l'ambiance de l'IETF: il n'est pas nécessaire d'avoir l'accord unanime de tous, mais plutôt de refléter un certain consensus. En plus, pour parvenir à une norme homologuée, il faut démontrer deux implantations indépendantes du protocole proposé réalisant l'interopérabilité de l'ensemble du protocole. De par son fonctionnement moins rigide que d'autres organismes de normalisation et de standardisation, l'IETF est souvent plus efficace et plus rapide pour faire avancer une norme, mais apparaît parfois un peu "brouillon" dans son fonctionnement. Un participant aux ateliers de l'IETF comprend cette dynamique. Paradoxalement, ce fonctionnement assure l'excellente qualité technique des normes homologuées. L'historique et la présence actuelle et future de l'Internet le confirment.
Une norme Internet est une spécification écrite, stable, techniquement solide, présentant plusieurs implantations indépendantes et interopérables avec une expérience réelle d'utilisation, soutenue de façon significative par la communauté, et utile pour une partie ou l'ensemble d'Internet. La norme a été homologuée par le processus de normalisation de l'IETF et possède un numéro de RFC ("Request For Comments"). La spécification est disponible sur Internet.
Chaque version d'une norme est publiée
sous forme d'un document appelé RFC (Request for Comments)
auquel on attribue un numéro unique. Ainsi, une version plus
récente d'une norme sera publiée sous un autre numéro
de RFC. Les numéros sont alloués de façon
séquentielle selon la date de leur dépôt. Ainsi
deux versions d'une même norme auront des numéros
différents et indépendants. L'IAB mandate un éditeur
[3] pour gérer les RFC. Jon
Postel de ISI (Information Sciences Institute [4])
jouait ce rôle depuis les débuts.
À la
différence d'autres organismes de normalisation et de
standardisation, l'auteur ou les auteurs de la norme sont identifiés
clairement dans l'en-tête du document RFC. Les documents sont
rédigés en anglais.
Un document RFC n'implique
pas qu'il s'agisse d'une norme reconnue et approuvée par
l'IETF. Cet état de fait est bien expliqué [5]
dans la RFC 1796. En effet, il existe plusieurs niveaux de normes.
Ces niveaux correspondent à la maturité de chacune des
normes.
Les normes proposées ("Proposed standard") correspondent au premier niveau de maturité. Elles ont obtenu une première approbation par le groupe de travail impliqué et par l'IESG. Elles sont généralement stables, sont bien définies, ont résolu les problématiques ciblées et sont considérées adéquates par la communauté.
Une norme en projet ("Draft standard") doit avoir été mise en oeuvre dans sa totalité par au moins deux logiciels distincts de sources différentes. Des tests doivent démontrer l'interopérabilité de ces logiciels. De plus, ce type de projet doit avoir été largement utilisé avant d'obtenir cette homologation. Un document de ce type doit être considéré comme une spécification complète et finale.
Les normes homologuées ("Standard") sont des normes décrites par une RFC et qui possèdent en plus un numéro de STD (STandarD). C'est le niveau de maturité le plus haut dans les normes de l'IETF. Elles correspondent à une norme homologuée, très bien définie, mise en pratique sur Internet et ayant atteint un haut niveau de maturité. Les normes STD adoptées à ce jour sont listées en annexe de ce document.
Certains documents RFC sont des conclusions sur la meilleure manière de faire certaines opérations ou d'exploiter certains protocoles. Ils possèdent en plus de leur numéro de RFC un numéro supplémentaire de BCP (Best Current Practice). Les bonnes pratiques actuelles ne constituent pas la spécification d'un protocole.
Plusieurs documents RFC ne sont ou ne
seront jamais des normes homologuées et officielles. Dans ce
cas, elles sont publiées avec la mention "Experimental"
ou "Informational", selon le cas. L'éditeur des RFC
en consultation avec l'IESG détermine cette mention.
Les
textes pour information ("Informational") sont
publiés pour l'intérêt général de
l'Internet. Elles ne font pas nécessairement l'objet d'un
consensus ou d'une recommandation. Des spécifications
produites en dehors du processus de l'IETF sont souvent publiées
comme "Informational".
Une norme expérimentale ("Experimental") désigne une spécification utilisée dans un travail de recherche et de développement. Elle est publiée pour l'intérêt général de l'Internet.
Une norme peut régulièrement être révisée. Lorsqu'une révision rend désuète la version précédente, celle-ci obtient le statut de norme historique ("Historic").
Durant le développement d'une spécification, des documents de travail appelés "Internet-Drafts" sont publiés aux fins de discussion. Ils sont disponibles dans un répertoire sur le serveur de l'IETF [6]. Lorsqu'un document de travail est transformé en document RFC ou est resté inchangé pendant 6 mois, le document est simplement retiré du répertoire. Il est important de comprendre que ces documents de travail n'ont aucune valeur de norme et ne sont pas homologués. Aucun appel d'offres ou document officiel ne devrait faire référence à ces documents de travail.
Pour qu'un document devienne une
norme, il doit en premier être écrit sous la forme d'un
document de travail ("draft") et être disponible
pendant un minimum de 2 semaines [7]
pour révision publique par la communauté. Ensuite, sur
recommandation du responsable du groupe de travail et du responsable
du domaine d'application, le document est soumis à l'IESG pour
approbation. Si le document satisfait aux différents critères
d'une norme, le document est soumis à un appel public à
commentaires. Selon les commentaires reçus et le jugement de
l'IESG, le document peut être soit homologué comme norme
dans la catégorie demandée ou dans une autre catégorie,
soit être refusé ou retardé.
Si la norme
est acceptée, l'IESG demande à l'éditeur des RFC
de publier la norme.
Dans le cas d'un texte de type
"Informational" ou "Experimental", le document
peut être soumis directement à l'éditeur des
RFC.
Un texte de type "Proposed Standard" doit
rester au moins 6 mois à ce niveau avant d'avancer au niveau
"Draft". De même, un texte de type "Draft"
doit rester au moins 4 mois à ce niveau avant d'avancer au
niveau "Standard".
Un texte n'atteignant pas le
niveau "Standard" et restant au même niveau pendant
24 mois sera revu par l'IESG tous les douze mois.
Les droits
de propriété intellectuelle sue les RFC sont cédés
de façon perpétuelle et illimitée à
l'Internet Society pour publication sans restriction. Lorsqu'une
spécification fait l'objet d'un brevet ou d'une protection
intellectuelle, l'IESG tentera d'obtenir un accord pour l'utilisation
sans restriction de cette spécification.
Le processus
de normalisation est détaillé avec toutes les modalités
[8] dans la RFC 2026.
Pour contribuer à une norme de l'IETF, voici quelques recommandations:
Lorsque la contribution est reliée aux travaux d'un groupe de travail existant [9], il est approprié de lire la charte du groupe, de s'abonner à la liste de discussions du groupe, de lire les archives de la liste pour connaître les discussions précédentes et de lire les RFC et les documents de travail produits par le groupe. Selon le résultat de ces démarches, on peut proposer une modification à un document ou en écrire un nouveau et le soumettre au groupe.
Lorsque la contribution ne semble pas être reliée à un groupe de travail existant, la première étape est probablement d'écrire un document de travail, même simple et incomplet. Ensuite, il est utile de le soumettre au responsable du domaine le plus pertinent pour la formation d'un groupe de travail. Les suites des discussions pourront amener la convocation d'une réunion de travail au prochain congrès de l'IETF pour discuter sur la pertinence de la formation d'un groupe de travail sur le sujet. Un document de travail peut aussi être soumis directement à l'IESG.
Peu importe la contribution, il est utile d'assister aux congrès de l'IETF qui ont lieu 3 fois par année. Malgré qu'une partie importante du travail et des discussions se fasse par courrier électronique, l'échange direct est encore très enrichissant, constructif et efficace.
Un document [10] décrit la manière d'écrire un document de travail.
La RFC 2223 donne des instructions [11] aux auteurs de documents RFC.
Les principales normes de l'IETF reliées à la
francisation et à l'internationalisation sont décrites
dans cette section. Il faut mentionner que l'IETF a approuvé
plus de 2200 documents au moment de l'écriture de ce rapport.
Pour aider le lecteur à s'y retrouver, nous avons regroupé
les documents par protocole ou par service Internet connu, tel que le
courrier électronique, la Toile mondiale, les nouvelles, etc.
Dans chaque regroupement, nous mentionnons en premier les normes
principales du protocole ainsi que celles plus directement reliées
à l'internationalisation. Nous listons dans une section
suivante les autres rextes reliés au protocole mais moins
pertinentes pour l'internationalisation. Enfin, une autre section
traite des travaux en cours sur ce protocole que nous trouvons utiles
pour le lecteur et valables au moment d'écrire ce
rapport.
Dans les tableaux listant les normes, la première
colonne indique le numéro de RFC relatif à cette norme.
La deuxième colonne indique l'état de la norme. On
distingue les codes suivants:
Code |
État du document |
S |
Standard : Norme |
D |
Draft Standard : projet de norme (à ne pas confondre avec un projet Internet, qui est une sorte de brouillon de RFC) |
P |
Proposed Standard : proposition de norme |
B |
Best Current Practice : Bonnes pratiques actuelles |
I |
Informational : RFC pour information |
E |
Experimental : RFC expérimentale |
Tableau 5.1 État des normes
Dans un contexte général,
les normes de l'IETF reliées à l'internationalisation
utilisent un codage binaire et un jeu de caractères précis
pour véhiculer l'information textuelle. La première
section sur les normes reliées à l'internationalisation
porte donc sur le codage.
La représentation de
l'information nécessite un codage particulier. Le codage
utilisé largement dans les protocoles de l'IETF est
l'US-ASCII, qui n'utilise que les 7 derniers bits d'un octet, bien
que l'octet soit aujourd'hui le plus petit élément de
données utilisé sur Internet pour véhiculer les
caractères. Ce codage ne permet aucune lettre
accentuée.
L'esprit de l'IETF consiste à ne pas
réinventer ce qui a été bien conçu
ailleurs. Ainsi, le codage utilisé du côté de la
francisation est le code ISO/CEI 8859-1, normalisé par l'ISO
et la CEI. Certains protocoles de l'IETF supportent ce codage,
d'autres non.
Les différents codes de caractères
utilisés dans les protocoles de l'IETF sont enregistrés
par l'IANA (Internet Assigned Numbers Autority), selon le processus
décrit dans la RFC 2278.
L'IETF envisage maintenant l'utilisation du jeu universel de
caractères ISO/CEI 10646 avec le codage UTF-8 tel que
mentionné dans la RFC 2130. Cette RFC de type "informational"
est le résumé des travaux d'un groupe de travail sur
l'internationalisation. Il existe aussi d'autres codages du jeu ISO
10646, tels que le codage UTF-7, ou encore son mode natif sur 2 ou
sur 4 octets.
Au mois d'août 1997, M. Harald T.
Alvestrand, responsable du domaine des applications à l'IETF,
a proposé l'orientation que devrait prendre l'IETF quant à
l'internationalisation. Cette proposition a été rédigée
selon les conclusions de la RFC 2130 et a été
homologuée sous la forme d'un "Best Current Practice",
portant le numéro 2277 et intitulé " IETF Policy
on Character Sets and Languages". Ce document est maintenant la
pierre angulaire des efforts d'internationalisation de l'IETF. À
cause de son impact potentiel par rapport au sujet de ce rapport,
nous encourageons fortement le lecteur à le lire.
En
résumé, la RFC 2277 établit les orientations
suivantes:
Tout protocole doit identifier le jeu de caractères utilisé
Tout protocole doit être en mesure d'utiliser le codage UTF-8 du jeu universel de caractères ISO/CEI 10646.
Tout protocole peut permettre d'autres jeux de caractères.
Tout protocole qui transfère du texte doit identifier la langue du texte
Les identifiants ne sont pas couverts par ce document. Les identifiants sont utilisés entre autres dans les noms de domaines, dans les adresses de courrier électronique et dans les adresses URL (pour le web).
Il est ainsi nécessaire de baliser la langue utilisée dans un texte quelconque. La RFC 1766 normalise les balises de langue.
Numéro de RFC |
État |
Titre |
1766 |
P |
Tags for Language names |
2130 |
I |
Report of the IAB Character Set Workshop held 29 February - 1 March, 1996 |
2152 |
I |
UTF-7 A Mail-Safe Transformation Format of Unicode |
2277 |
B |
IETF Policy on Character Sets and Languages |
2278 |
|
IANA Charset Registration Procedures |
2279 |
I |
UTF-8, a Transformation Format of ISO 10646 |
Tableau 5.2 RFC sur le codage des messages
Dans beaucoup de travaux sur la francisation et l'internationalisation dans les technologies de l'information, l'ISO [12] (associée à la CEI) joue un rôle clé. Les travaux de l'ISO et de la CEI ont entre autres produit les jeux de caractères ISO/CEI 8859-1 et ISO/CEI 10646. Une nouvelle partie [13] de la série de normes ISO/CEI 8859 (jeux de caractères codés sur huit bits), assurant l'inclusion du symbole euro ainsi qu'une correction par rapport à l'ISO/CEI 8859-1 pour mieux soutenir certaines langues comme le français et le finnois, est actuellement en développement, les premiers votes ayant déjà eu lieu au moment d'écrire ce rapport.
La norme MIME est utilisée pour définir le format
des messages multimédia sur Internet. Un message codé
selon la norme MIME contient les en-têtes nécessaires
pour décrire le type de données utilisé. Le
contenu du message peut être composé d'un ou plusieurs
des éléments suivants : texte, image, son, fichier
binaire quelconque, etc.
Un message MIME contient les
principaux en-têtes suivants:
Nom de l'en-tête |
Description |
MIME-Version |
indique que le message est de type MIME et identifie la version du protocole MIME |
Content-Type |
identifie le type de contenu, comme par exemple que le contenu est du texte, une image gif, un fichier Word, etc. Le nom des balises est normalisé. |
Content-Transfer-Encoding |
identifie le codage du contenu. |
Tableau 5.3 En-têtes MIME
Les messages contenant des
caractères accentués ont un codage spécifié
dans l'en-tête "Content-Transfer-Encoding".
Initialement
prévue pour le courrier électronique, la norme MIME est
aussi utilisée pour les transactions de la Toile mondiale et
dans la lecture des nouvelles Usenet.
Numéro de RFC |
État |
Titre |
2045 |
D |
Multipurpose Internet Mail Extensions (MIME) Part One: Format of Internet Message Bodies |
2046 |
D |
Multipurpose Internet Mail Extensions (MIME) Part Two: Media Types |
2047 |
D |
MIME (Multipurpose Internet Mail Extensions) Part Three: Message Header Extensions for Non-ASCII Text |
2048 |
B |
Multipurpose Internet Mail Extension (MIME) Part Four: Registration Procedures |
2049 |
D |
Multipurpose Internet Mail Extensions (MIME) Part Five: Conformance Criteria and Examples |
2183 |
P |
Communicating Presentation Information in Internet Messages: The Content-Disposition Header |
2110 |
P |
MIME E-mail Encapsulation of Aggregate Documents, such as HTML (MHTML) |
2231 |
P |
MIME Parameter Value and Encoded Word Extensions: Character Sets, Languages, and Continuations |
Tableau 5.4 Documents RFC sur MIME
Les RFC suivantes sont intégrées au protocole mais ne sont pas strictement reliés à l'internationalisation.
Numéro de RFC |
État |
Titre |
1896 |
I |
The text/enriched MIME Content-type |
1740 |
P |
MIME Encapsulation of Macintosh Files - MacMIME |
1741 |
I |
MIME Content Type for BinHex Encoded Files |
1767 |
P |
MIME Encapsulation of EDI Objects |
2017 |
P |
Definition of the URL MIME External-Body Access-Type |
Tableau 5.5 Autres documents RFC sur MIME
Depuis plusieurs années, plusieurs groupes de travail de l'IETF ont tenté d'enrichir le protocole MIME pour assurer la sécurité des messages par les mécanismes de chiffrement et de signature. Le présent rapport n'a pas pour objet de discuter des fonctions de sécurité, mais on peut affirmer que le chiffrement est un codage supplémentaire aux autres mécanismes de codage de l'information. Ainsi, il peut avoir une influence sur le résultat final du contenu du message. Les deux principaux protocoles de sécurité, utilisés conjointement avec MIME, sont PGP-MIME décrit dans le RFC 2015 et SMIME. Ce dernier est l'objet d'un groupe de travail au moment de l'écriture de ce rapport.
Numéro de RFC |
État |
Titre |
2015 |
P |
MIME Security with Pretty Good Privacy (PGP) |
Tableau 5.6 Normes de sécurité avec MIME
On peut décrire succintement les mécanismes fonctionnels du Web par les trois éléments suivants:
le langage HTML permettant de décrire les pages Web,
le protocole HTTP pour les transactions entre un logiciel client et un serveur,
et les URL qui déterminent l'endroit où se trouve un document.
HTML ("HyperText Markup Language") est un langage
pour créer des documents indépendants du logiciel ou du
matériel où ils sont visualisés. Les documents
HTML sont utilisés sur la Toile depuis 1990. HTML utilise
présentement un alphabet basé sur le jeu de caractères
ISO/CEI 8859-1. Les documents HTML utilisent la norme MIME pour
décrire leur contenu.
Une norme [14]
assurant l'internationalisation au-delà du jeu de caractères
ISO/CEI 8859-1 a été homologuée dans le document
RFC2070. Elle décrit l'utilisation du jeu de caractère
ISO/CEI 10646 dans le langage HTML.
Le protocole HTTP est
utilisé pour transmettre les données du Web. Ce
protocole utilise la norme MIME pour décrire la nature des
données qui sont transmises. Pour assurer la négociation
des paramètres d'internationalisation, HTTP (v1.1) supporte
les en-têtes suivants.
En-tête |
Description |
Accept-Charset |
Permet à un client d'informer le serveur des jeux de caractères qu'il peut accepter. |
Accept-Encoding |
Permet à un client d'informer le serveur de l'encodage qu'il peut accepter. |
Accept-Language |
Permet à un client d'informer le serveur des langues préférées lors de la réponse. |
Content-Encoding |
Identifie le codage utilisé dans la transmission d'un document ou d'un message. |
Content-Language |
Identifie la langue utilisée dans la transmission d'un document ou d'un message. |
Tableau 5.7 En-têtes HTTP reliés à l'internationalisation
Numéro de RFC |
État |
Titre |
2068 |
P |
Hypertext Transfer Protocol -- HTTP/1.1 |
1866 |
P |
Hypertext Markup Language - 2.0 |
1738 |
P |
Uniform Resource Locators (URL) |
2070 |
P |
Internationalization of the Hypertext Markup Language |
2141 |
P |
URN Syntax |
Tableau 5.8 RFC sur les protocoles de la Toile
Il faut mentionner que le World Wide Web Consortium [15] (W3C) joue un rôle majeur dans la normalisation des protocoles du Web. Le lecteur intéressé devrait consulter attentivement les résultats des travaux du W3C. Au moment de l'écriture du rapport, plusieurs travaux sont en cours au W3C sur l'internationalisation, notamment la version 4 du langage HTML.
La transmission du courrier
électronique sur Internet utilise le protocole SMTP (Simple
Mail Transfer Protocol, RFC 821). La définition du protocole
SMTP a été publiée en 1982. À cette
époque, l'utilisation de caractères autre que ceux de
l'US-ASCII n'était pas une préoccupation aux
États-Unis. Par conséquent, la définition du
protocole SMTP prévoit que l'utilisation du jeu de caractères
US-ASCII.
Un groupe de travail a été mis en
place à l'IETF (Internet Engineering Task Force) il y a
plusieurs années pour moderniser le courrier électronique
de manière à ce qu'il supporte les caractères
accentués, les pièces jointes et les éléments
multimédias. Les travaux de ce groupe de travail ont été
très lents à produire des résultats. Pendant ce
temps, sous la pression des clients, plusieurs producteurs de
logiciels et de systèmes d'exploitation ont dévié
de la norme SMTP à 7 bits pour supporter intégralement
les 8bits de chaque octet, assurant ainsi l'usage des caractères
accentués avec le codage implicite ISO/CEI 8859-1. Les
utilisateurs européens, québécois et autres ont
donc utilisé ces extensions non-normalisées
puisqu'elles leur permettaient d'échanger du courrier
électronique dans leur langue. À posteriori, le mode 8
bits a été normalisé en prévoyant une
négociation préalable entre le logiciel client et le
logiciel serveur, avec le mode "Extended SMTP" décrit
dans les documents RFC 1869,1652 et 1428. Plusieurs problèmes
que nous vivons aujourd'hui avec le courrier électronique
accentué tirent leur origine du cours de ces événements.
La
norme MIME prévoit un codage des messages au delà du
jeu de caractères US-ASCII (ISO/CEI 646). Il permet de
contourner les contraintes imposées par le protocole SMTP et
d'assurer l'usage de caractères accentués dans le
courrier électronique.
L'utilisation de MIME avec un
code à 7bits pour les caractères accentués
(souvent appelé mode QP (Quoted Printable) dans les logiciels
de courrier électronique) ou l'utilisation du codage à
8 bits avec le mode "Extended SMTP" constituent les seules
façons de garantir l'acheminement des caractères
accentués sur Internet.
Les protocoles POP3 ou IMAP4
sont utilisés pour permettre à un utilisateur de
télécharger ses messages de courrier électronique
à partir d'un serveur. IMAP4 offre en plus des fonctions de
gestion de boîte de courrier à distance.
Numéro de RFC |
État |
Titre |
821 |
S |
Simple Mail Transfer Protocol (SMTP) |
822 |
S |
Format of mail messages |
1869 |
S |
SMTP Service Extensions |
1652 |
D |
SMTP Service Extension for 8bit-MIMEtransport |
1428 |
I |
Transition of Internet Mail from Just-Send-8 to 8bit-SMTP/MIME |
1939 |
D |
Post Office Protocol (POP3) |
2060 |
P |
Internet Message Access Protocol (IMAP4) |
1049 |
S |
Content type headers |
2076 |
I |
Common Internet Message Headers |
Tableau 5.9 Documents RFC sur le courrier électronique
Numéro de RFC |
État |
Titre |
1891 |
P |
SMTP Service Extension for Delivery Status Notifications |
1892 |
P |
The Multipart/Report Content Type for the Reporting of Mail System Administrative Messages |
1893 |
P |
Enhanced Mail System Status Codes |
1894 |
P |
An Extensible Message Format for Delivery Status Notifications |
2034 |
P |
SMTP Service Extension for Returning Enhanced Error Code |
2095 |
P |
IMAP/POP AUTHorize Extension for Simple Challenge/Response |
2192 |
P |
IMAP URL Scheme |
Tableau 5.10 Autres documents RFC sur le courrier électronique
Le consortium IMC (Internet Mail Consortium [16]), fondé par deux experts dans ce domaine, constitue un point de coordination pour le développement et l'implantation des normes reliées au courrier électronique sur Internet. Par la représentation de ses membres, il contribue de façon importante aux activités de normalisation de l'IETF autant dans la phase de conception que dans la phase d'implantation et de tests d'interopérabilité. Le lecteur intéressé devrait consulter attentivement les travaux de l'IMC.
Les annuaires électroniques
permettent aux usagers d'Internet d'interroger une base de données
et ainsi de trouver de l'information sur un individu, une entité
ou un objet du réseau. Historiquement, pour les besoins de
gestion du réseau, la base de données Whois était
utilisée. Depuis, plusieurs protocoles différents ont
été testés ou utilisés, tels que X.500,
ph/qi, whois++. L'orientation courante est d'utiliser le protocole
d'accès aux annuaires LDAP (Lightweight Directory Access
Protocol).
La base de données Whois est un répertoire
électronique accessible sur Internet qui permet la recherche
d'individus, de noms de domaines, de noms de machines clés et
d'autres informations d'intérêt pour les internautes. Ce
service est maintenu par le Network Information Center (NIC). Whois++
est une revision du service Whois ajoutant un niveau d'information
plus structuré, ainsi que la possibilité d'utiliser
différents langages et alphabets.
Ph/Qi est un
protocole simple et un logiciel permettant l'accès à un
seul annuaire. Plusieurs logiciels de courrier électronique,
tels qu'Eudora, utilisent ce protocole. Il a été
documenté à posteriori dans un document de travail
[17]. Il est limité quant à
sa capacité de gérer l'accès à de
multiples annuaires, sans connaissance préalable du serveur.
Quant à l'internationalisation, les implémentations
initiales ne supportaient que les caractères US-ASCII, mais le
document de travail propose des extensions pour soutenir le codage
ISO/CEI 8859-1.
LDAP (Lightweight Directory Access Protocol)
se veut une alternative plus simple au protocole DAP (Directory
Access Protocol) de la norme ISO X.500 pour offrir un annuaire
électronique sur Internet. Plusieurs manufacturiers
soutiennent déjà LDAP. Ce protocole correspond à
l'orientation courante de l'IETF en matière d'annuaires
électroniques. La version 3 de LDAP, tout récemment
homologuée, utilise le codage UTF-8 du jeu universel de
caractères ISO/CEI 10646.
Numéro de RFC |
État |
Titre |
1777 |
D |
Lightweight Directory Access Protocol (LDAP) |
1959 |
P |
LDAP URL Format |
1834 |
I |
Whois and Network Information Lookup Service (Whois++) |
Tableau 5.11 Documents RFC sur les annuaires
Numéro de RFC |
État |
Titre |
1778 |
D |
String Representation of Standard Attribute Syntaxes |
1960 |
P |
String Representation of LDAP Search Filters |
1835 |
P |
Architecture of the Whois++ Service |
1913 |
P |
Architecture of the Whois++ Index Service |
2079 |
P |
Definition of an X.500 Attribute Type and an Object Class to Hold Uniform Resource Identifiers (URI) |
2218 |
P |
A Common Schema for the Internet White Pages Service |
Tableau 5.12 Autres documents RFC sur les annuaires
Les travaux du groupe de travail LDAPEXT proposent présentement une extension pour supporter les balises identifiant la langue utilisée dans le contenu.
Le consortium IMC joue aussi un rôle
de coordination pour le développement et l'implantation des
normes reliées aux annuaires sur Internet. Le lecteur
intéressé devrait consulter attentivement les travaux
de l'IMC (http://www.imc.org).
Concomitant
aux annuaires, le protocole vCard [18]
a été proposé par le consortium Versit et est
présentement maintenu par le consortium IMC. Ce protocole
permet de créer l'équivalent de la carte d'affaires sur
Internet. Une version normalisée par l'IETF est en cours de
développement.
Le DNS est un service de base de
données distribuée sur Internet. Ce service permet en
outre d'établir une correspondance entre l'adresse internet et
le nom d'une machine.
Différentes restrictions
existent quant au choix des noms de machines. Le nom d'une machine ne
doit pas dépasser 63 caractères et doit être
composé de certains caractères codés en
US-ASCII, limités aux lettres, aux chiffres et au caractère
'-' seulement. Ainsi, pour le moment, aucune francisation intégrale
ou internationalisation des noms de domaines n'est possible.
Voici
les principaux documents relatifs au DNS.
Numéro de RFC |
État |
Titre |
974 |
S |
Mail Routing and the Domain System |
1034 |
S |
Domain names - concepts and facilities |
1035 |
S |
Domain Names--Implementation and Specification |
1155 |
S |
Structure and identification of management information for TCP/IP-based internets |
Tableau 5.13 Documents RFC sur les noms de domaine
Numéro de RFC |
État |
Titre |
1912 |
I |
Common DNS Operational and Configuration Errors |
2181 |
P |
Clarifications to the DNS Specification |
2219 |
B |
Use of DNS Aliases for Network Services |
1995 |
P |
Incremental Zone Transfer in DNS |
1464 |
E |
Using the Domain Name System To Store Arbitrary String Attributes |
1178 |
I |
Choosing a Name for Your Computer |
1101 |
|
DNS Encoding of Network Names and Other Types |
Tableau 5.14 Autres documents RFC sur les noms de domaine
Le protocole Telnet permet l'accès à un ordinateur par l'entremise d'un terminal distant. La plupart des implantations supportent différents émulateurs de terminaux. Si leurs caractéristiques le permettent, ceux-ci soutiennent correctement les caractères accentués.
Numéro de RFC |
État |
Titre |
854 |
S |
Telnet Protocol specification |
855 |
S |
Telnet option specifications |
Le protocole FTP assure le transfert de fichiers d'un ordinateur à un autre. Les fichiers peuvent être de format quelconque, ce qui permet le format binaire et les caractères accentués. Ainsi, le transfert de fichiers en français ne cause pas de problèmes. Cependant, les noms des fichiers doivent être strictement en ASCII, restreignant ainsi l'utilisation du français dans les noms de fichiers.
Numéro de RFC |
État |
Titre |
959 |
S |
File Transfer Protocol |
Tableau 5.16 Documents RFC sur FTP
Des travaux sont en cours par le groupe de travail FTPEXT pour internationaliser le protocole FTP. Un document de travail[19] propose une extension pour soutenir le codage UTF-8 du jeu de caractères ISO/CEI 10646 dans les noms de fichiers.
Les RFC suivantes définissent
les exigences générales auxquelles doivent adhérer
les machines sur Internet. Ces RFC concernent les applications et les
protocoles.
Numéro de RFC |
État |
Titre |
---|---|---|
1122 |
S |
Requirements for Internet Hosts - Communication Layers |
1123 |
S |
Requirements for Internet Hosts - Application and Support |
Tableau 5.17 Documents RFC sur les exigences générales
Selon les orientations tracées
par l'IETF récemment, il nous semble clair que le support du
jeu de caractères ISO/CEI 10646 à l'aide du codage
UTF-8 doit être prévu dès la conception d'un
logiciel qui sera utilisé sur Internet. Il doit aussi être
prévu de prendre en charge ISO/CEI 8859-1 pour le français.
La norme ISO/CEI 8859-15 serait aussi à considérer,
bien que son homologation ne soit pas terminée.
Considérant
les efforts très importants pour étiqueter la langue
utilisée dans le texte lorsque cela est fait à
posteriori, il nous semble clair que la conception d'un logiciel
devrait intégrer l'inclusion des balises de langue selon la
RFC 1766 et prévoir un usage multilingue.
Enfin, tout
balisage de document et de codage devrait utiliser la norme MIME.
Il existe de multiples sources d'informations au sujet des normes de l'Internet. Nous n'en nommerons que quelques-unes.
Titre |
Adresse |
Description |
IETF |
Site web de l'IETF |
|
IESG |
Site web de l'IESG |
|
RFC Editor |
Site web du responsable des RFC où on trouvera la liste et les liens pour accéder au exte des RFC. |
|
Index des RFC |
Liste officielle des RFC courantes avec leur état. |
|
Internet Monthly Report |
Très complet, mais semble ne plus exister. |
Ce rapport mensuel liste toutes les nouvelles RFC, les nouveaux documents de travail, les activités de normalisation et d'enregistrement. |
Liste IETF |
Liste de discussions ouverte regroupant les personnes impliquées dans l'IETF. |
|
W3C |
http://www.w3c.org |
Site du World Wide Web Consortium. |
Tableau 7.1 Sources d'information
Nous avons fait tous les efforts possibles pour que le présent document soit exact au moment de sa rédaction. Cependant, considérant l'évolution très rapide des normes de l'IETF et l'évolution de l'IETF elle-même, ce document deviendra tôt ou tard incomplet. Cette section donne au lecteur quelques suggestions pour s'assurer d'avoir accès à l'information la plus récente.
Pour vérifier l'état d'une RFC, on peut consulter l'index des RFC [20]. Cet index est toujours mis à jour par le responsable de l'édition des RFC. Il permet d'identifier l'état de la RFC ainsi que les modifications subséquentes du protocole documentées à l'intérieur d'autres RFC.
Une RFC peut avoir été mise à jour partiellement par une autre RFC. L'index des RFC mentionné plus haut précise les relations entre les RFC.
Il est important de connaître les travaux en cours à l'IETF. En effet, un protocole peut à tout moment être soumis à une révision par un groupe de travail. Le fait de consulter la RFC adéquate assure seulement la connaissance du protocole normalisé, mais pas nécessairement des prochaines versions. La liste des groupes de travail actifs devrait être consultée [21].
Les documents de travail ("drafts") ne sont conservés que 6 mois sur le serveur [22] de l'IETF. Ainsi, il est possible que la référence à un document "draft" ne soit plus valide. Généralement, les documents ont toujours un numéro de version dans le titre. Il est important de vérifier si une version plus récente existe. Un document de travail peut aussi avoir été converti en RFC. On peut aussi se référer à la page du groupe de travail[ 23] auquel est assigné ce document de travail.
Au moment d'écrire ce rapport, les deux listes de courrier électronique suivantes servent aux discussions sur l'internationalisation.
Tableau 8.1 Listes de discussion de l'IETF sur l'internationalisation
On peut s'abonner à ces listes en envoyant un message ayant comme contenu le mot "subscribe" à l'adresse mentionnée au tableau précédent.
Ce rapport tente d'orienter le lecteur
sur les principales normes de l'Internet reliées à la
francisation et l'internationalisation. Il faut comprendre que le
fait qu'une norme soit homologuée ne constitue pas
nécessairement une preuve qu'elle est utilisée sur
Internet. Au lieu de donner une liste exhaustive de toutes les normes
homologuées par l'IETF, nous avons tenté de lister les
plus importantes et les plus pertinentes. Cet exercice est
nécessairement imparfait, mais nous le croyons beaucoup plus
utile. Sachant que ce document est sujet à l'obsolescence,
nous donnons au lecteur certaines pistes pour le remettre à
jour.
Nous désirons remercier M. Alain Labonté
pour ses suggestions très pertinentes sur ce document.
Les RFC sont disponibles à l'adresse http://www.rfc-editor.org/. Les documents de travail (drafts) sont disponibles à l'adresse ftp://ftp.ietf.org/internet-drafts.
Le tableau suivant liste les normes homologuées ("Standard") lors de la rédaction de ce rapport. Cette homologation ne signifie pas nécessairement qu'elles sont toutes utilisées sur Internet, mais atteste plutôt de leur haut degré de maturité et de la reconnaissance par la communauté. Cette liste est disponible dans la RFC 2200. (Voir la liste à jour à https://www.rfc-editor.org/standards)
STD |
Titre |
Auteurs |
Date |
RFC correspondante |
1 |
Internet Official Protocol Standards |
J. Postel |
01/06/97 |
|
2 |
Assigned Numbers |
J. Reynolds, J. Postel |
01/10/94 |
|
3 |
Host Requirements |
R. Braden |
01/10/89 |
RFC1122, RFC1123 |
4 |
Gateway Requirements |
R. Braden, J. Postel |
01/06/87 |
RFC1009 |
5 |
Internet Protocol |
J. Postel |
01/09/81 |
RFC0791, RFC0950, RFC0919, RFC0922, RFC792, RFC1112 |
6 |
User Datagram Protocol |
J. Postel |
01/08/80 |
RFC0768 |
7 |
Transmission Control Protocol |
J. Postel |
01/09/81 |
RFC0793 |
8 |
Telnet Protocol |
J. Postel, J. Reynolds |
01/05/83 |
RFC0854, RFC0855 |
9 |
File Transfer Protocol |
J. Postel, J. Reynolds |
01/10/85 |
RFC0959 |
10 |
SMTP Service Extensions |
J. Klensin, N.Freed, M. Rose, |
01/11/95 |
RFC821, RFC1869 |
11 |
SMTP Service Extension for Message Size Declaration |
J. Klensin,N. Freed, K. Moore |
01/11/95 |
RFC1870 |
|
Standard for the format of ARPA Internet text messages |
D. Crocker |
01/08/82 |
RFC0822 |
12 |
Network Time Protocol |
D. Mills |
01/09/89 |
RFC1119 |
13 |
Domain Name System |
P.Mockapetris |
01/11/87 |
RFC1034, RFC1035 |
14 |
Mail Routing and the Domain System |
C. Partridge |
01/01/86 |
RFC0974 |
15 |
Simple Network Management Protocol |
J. Case, M. Fedor, M. Schoffstall, J. Davin |
01/05/90 |
RFC1157 |
16 |
Structure of Management Information |
M. Rose, K. McCloghrie |
01/05/90 |
RFC1155, RFC1212 |
17 |
Management Information Base |
K.McCloghrie, M. Rose |
01/03/91 |
RFC1213 |
18 |
Exterior Gateway Protocol |
D. Mills |
01/04/84 |
RFC0904 |
19 |
NetBIOS Service Protocols |
Groupe de travail NetBIOS |
01/03/87 |
RFC1001, RFC1002 |
20 |
Echo Protocol |
J. Postel |
01/05/83 |
RFC0862 |
21 |
Discard Protocol |
J. Postel |
01/05/83 |
RFC0863 |
22 |
Character Generator Protocol |
J. Postel |
01/05/83 |
RFC0864 |
23 |
Quote of the Day Protocol |
J. Postel |
01/05/83 |
RFC0865 |
24 |
Active Users Protocol |
J. Postel |
01/05/83 |
RFC0866 |
25 |
Daytime Protocol |
J. Postel |
01/05/83 |
RFC0867 |
26 |
Time Server Protocol |
J. Postel |
01/05/83 |
RFC0868 |
27 |
Binary Transmission Telnet Option |
J. Postel, J. Reynolds |
01/05/83 |
RFC0856 |
28 |
Echo Telnet Option |
J. Postel, J. Reynolds |
01/05/83 |
RFC0857 |
29 |
Suppress Go Ahead Telnet Option |
J. Postel, J. Reynolds |
01/05/83 |
RFC0858 |
30 |
Status Telnet Option |
J. Postel, J. Reynolds |
01/05/83 |
RFC0859 |
31 |
Timing Mark Telnet Option |
J. Postel, J. Reynolds |
01/05/83 |
RFC0860 |
32 |
Extended Options List Telnet Option |
J. Postel, J. Reynolds |
01/05/83 |
RFC0861 |
33 |
Trivial File Transfer Protocol |
K. Sollins |
01/07/92 |
RFC1350 |
34 |
Routing Information Protocol |
C. Hedrick |
01/06/88 |
RFC1058 |
35 |
ISO Transport Service on top of the TCP (Version: 3) |
M. Rose, D. Cass |
01/05/78 |
RFC1006 |
36 |
Transmission of IP and ARP over FDDI Networks |
D. Katz |
01/01/93 |
RFC1390 |
37 |
An Ethernet Address Resolution Protocol |
David C. Plummer |
01/11/82 |
RFC0826 |
38 |
A Reverse Address Resolution Protocol |
Ross Finlayson, Timothy Mann, Jeffrey Mogul, Marvin Theimer |
01/06/84 |
RFC0903 |
39 |
Interface Message Processor: Specifications for the Interconnection of a Host and an IMP (Revised) |
BBN |
01/12/81 |
|
40 |
Host Access Protocol specification |
Bolt Beranek et Newman |
01/08/93 |
RFC1221 |
41 |
Standard for the transmission of IP datagrams over Ethernet networks |
C. Hornig |
01/04/84 |
RFC0894 |
42 |
Standard for the transmission of IP datagrams over experimental Ethernet networks |
J. Postel |
01/04/84 |
RFC0895 |
43 |
Standard for the transmission of IP datagrams over IEEE 802 networks |
J. Postel, J.K. Reynolds |
01/08/93 |
RFC1042 |
44 |
DCN Local-Network Protocols |
D.L. Mills |
01/08/93 |
RFC0891 |
45 |
Internet Protocol on Network System's HYPERchannel: Protocol Specification |
K. Hardwick, J. Lekashman |
01/08/93 |
RFC1044 |
46 |
Transmitting IP traffic over ARCNET networks |
D. Provan |
01/08/93 |
RFC1201 |
47 |
Nonstandard for transmission of IP datagrams over serial lines: SLIP |
J.L. Romkey |
01/08/93 |
RFC1055 |
48 |
Standard for the transmission of IP datagrams over NetBIOS networks |
L.J. McLaughlin |
01/08/93 |
RFC1088 |
49 |
Standard for the transmission of 802.2 packets over IPX networks |
L.J. McLaughlin |
01/08/93 |
RFC1132 |
50 |
Definitions of Managed Objects for the Ethernet-like Interface Types |
F. Kastenholz |
01/07/94 |
RFC1643 |
51 |
The Point-to-Point Protocol (PPP) |
W. Simpson, éditer |
01/07/94 |
RFC1661, RFC1662 |
52 |
The Transmission of IP Datagrams over the SMDS Service |
D. Piscitello, J. Lawrence |
01/03/91 |
RFC1209 |
53 |
Post Office Protocol - Version 3 |
J. Myers, M. Rose |
01/05/96 |
RFC1939 |
Nom |
Signification |
ANSI |
(American National Standards Institute) Institut des normes nationales américaines |
ARPA |
(Advanced Research Projects Agency) Agende pour les projets de recherches avancées |
AS |
(Applicability Statement) déclaration d'applicabilité |
FTP |
(File Transfer Protocol) protocole de transfert de fichiers |
ASCII |
(American Standard Code for Information Interchange) Norme américaine de codage pour les échanges d'informations |
ITU-T |
(International Telecommunication Union) Union Internationale des Télécommunications - Secteur de la normalisation des télécommunications (UIT-T) |
IAB |
(Internet Architecture Board) Bureau de l'architecture de l'Ibnternet |
IANA |
(Internet Assigned Numbers Authority) Autorité d'allocation des numéros de l'Internet |
IEEE |
(Institute of Electrical and Electronics Engineers) association internationale des ingénieurs en électronique et éléctricité |
ICMP |
(Internet Control Message Protocol) Protocole des messages de commandes de l'Internent |
IESG |
(Internet Engineering Steering Group) groupe de pilotage de l'ingénierie de l'Internet |
IETF |
(Internet Engineering Task Force) Équipe d'ingénierie de l'Internet |
IP |
(Internet Protocol) protocole Internet |
IRSG |
(Internet Research Steering Group) groupe de pilotage de la recherche sur l'Internet |
IRTF |
(Internet Research Task Force) Équipe de recherche dur l'Internet |
ISO |
(International Organization for Standardization) Organisation mondiale de normalisation |
ISOC |
(Internet Society) Société Internet |
MIB |
(Management Information Base) base de données d'informations de gestion |
OSI |
(Open Systems Interconnection) interconnexion des systèmes ouverts |
RFC |
Request for Comments (demande de commentaires) |
TCP |
(Transmission Control Protocol) protocole de contrôle de transmission |
TS |
(Technical Specification) spécification technique |
WWW |
(World Wide Web) la Toile mondiake |
Tableau 12.1 Liste des acronymes
[1]
URL : http://www.ietf.org/ .
[2]
URL : http://www.ietf.org/html.charters/wg-dir.html
.
[3] URL :
http://www.isi.edu/rfc-editor
[4]
URL : http://www.isi.edu. L'ISI est
un institut rattaché à l'université de la
Californie du Sud (USC).
[5] URL :
http://ds.internic.net/rfc/rfc1796.txt
[6]
URL : http://www.ietf.org/internet-drafts
[7]
En pratique, ce processus est généralement beaucoup
plus long.
[8] URL :
http://ds.internic.net/rfc/rfc2026.txt
[9]
voir liste des groupes à l'adresse
http://www.ietf.org/html.charters/wg-dir.html
.
[10] URL :
ftp://ftp.ietf.org/ietf/1id-guidelines.txt
[11]
URL : http://ds.internic.net/rfc/rfc2223.txt
[12]
URL : http://www.iso.ch
[13]
À ce titre, il nous faut mentionner la contribution importante
d'un Québécois: M. Alain LaBonté du Gouvernement
du Québec, qui est l'auteur ou un contributeur important de
plusieurs normes de l'ISO sur les jeux de caractères, sur le
tri et les configurations de claviers.
[14]
Cette RFC a été écrite par un Québécois
: M. François Yergeau.
[15]
ou W3C: http://www.w3c.org
[16]
URL : http://www.imc.org
[17]
URL :
ftp://ftp.ietf.org/internet-drafts/draft-ietf-ids-ph-04.txt
[18]
URL : http://www.imc.org/pdi/
[19]
URL :
ftp://ftp.ietf.org/internet-drafts/draft-ietf-ftpext-intl-ftp-03.txt
[20]
URL : ftp://ftp.isi.edu/in-notes/rfc-index.txt
[21]
URL : http://www.ietf.org/html.charters/wg-dir.html
[22] URL :
ftp://ftp.ietf.org/internet-drafts
[23]
URL : http://www.ietf.org/html.charters/wg-dir.html
Accueil
| Qui sommes-nous ?
| Bibliothèque
virtuelle | Événements
à signaler | Vitrine
VOIL
Normes et
standards | Francisation
des inforoutes | IETF
et W3C | Nos
coordonnées | Courriel
| Recherche