(rubrique)

Accueil > Référencement Web Inc. > Convertir des pages en UTF-8

Convertir des pages en UTF-8

Il vous arrive peut-être de devoir mettre à jour un vieux projet web écrit en ANSI ISO-8859-1 et vous voulez probablement le convertir en UTF-8, ce dernier devenu le format d’encodage le plus abouti aujourd’hui, alors qu’il y a une dizaine d’années, le format d’encodage par défaut en Europe était l’ISO-8859-1. Aujourd’hui, c’est la place à l’UTF-8. Cet encodage a l’avantage de gérer la plupart des langages pour les sites multilingues.

À noter, ISO-8859-1 est un encodage dit local alors qu’UTF-8 est un langage dit international. Lors du développement web, il y a plusieurs niveaux d’encodages : l’encodage propre au fichier (.Php, .Html, .Css). La déclaration du charset pour l’interprétation des caractères.

Le navigateur web (Firefox, Chrome, etc.) se servira du charset pour interpréter et donc décoder les caractères reçus depuis le serveur web. À noter que si il y a une incohérence d’encodage et de charset, les caractères interprétés seront mal décodés. On parle plus communément de Jeu de Caractères appliqué à un fichier pour décrire l’encodage.

Voici comment convertir votre site en UTF-8 sous Linux.

Sous Linux, l’outil de ligne de commande iconv est utilisé pour convertir le texte d’une forme d’encodage à une autre. Vous pouvez vérifier l’encodage d’un fichier à l’aide de la commande file, en utilisant l’indicateur -i ou —mime qui permet l’impression de la chaîne de type mime comme dans les exemples ci-dessous :

$ file -i exemple.php

La syntaxe d’utilisation de iconv est la suivante :

$ iconv option
$ iconv options -f from-encoding -t to-encoding inputfile(s) -o outputfile

-f ou —from-code signifie codage d’entrée et -t ou —to-encoding pour spécifie le codage de sortie.

Pour répertorier tous les jeux de caractères codés connus, exécutez la commande ci-dessous :

$ iconv -l

Ensuite, nous apprendrons comment convertir d’un codage à un autre. La commande ci-dessous ex, convertit le codage ISO-8859-1 en codage UTF-8.

Considérons qu’un fichier nommé premier.php contient les caractères :

par Référencement Web, vendredi 1er mai 2020


Voir en ligne : tecmint.com