Text Converter : syntaxe

Syntaxe de Text Converter

Retour Précédent Suivant

La syntaxe pour un Fichier de conversion est la suivante :

Seules les lignes commençant par / ou " sont utilisées. Les autres sont ignorées.

Chaque chaîne à convertir se présente sous la forme suivante : "A" -> "B". La chaîne d'origine, celle que vous recherchez, est comprise entre guillemets, suivie d'un espace, d'un trait d'union, du symbole > et de la chaîne de remplacement.

Codes de contrôle

Les codes de contrôle peuvent être symbolisés ainsi : {CHR(xxx)} où xxx est le code. Exemples : {CHR(13)} correspond à un retour chariot, {CHR(10)} correspond à un saut de ligne, {CHR(9)} correspond à une tabulation, {CHR(12)} correspond à l'alimentation papier. Pour représenter le signe <Entrée> qui apparaît à la fin des paragraphes et parfois à la fin de chaque ligne, il faut saisir {CHR(13)}{CHR(10)}, qui correspond à un retour-chariot immédiatement suivi d'un saut de ligne.

Saisissez {CHR(34)} pour indiquer des apostrophes inversées doubles (utilisées en anglais).

Caractères de remplacement (*,?,# and ~)

* Vous pouvez utiliser l'astérisque comme caractère de remplacement. Ainsi, "<*>" -> "" supprimera de votre texte toute chaîne située entre < >. "<head */head>" supprimera toute chaîne commençant par "<head " et se terminant par "/head>", même si des centaines de caractères se trouvent entre ces deux éléments. L'étendue de la recherche par défaut est de 1 000 caractères, et cette valeur peut aller jusqu'à 25 000. Le texte est lu segment par segment, avec une mise en tampon de 30 000 caractères. La valeur maximum peut donc convenir au début du texte, mais après cela, seul un espace de recherche de 1 000 caractères pourra être garanti. Supprimer une grande quantité de texte peut éliminer plus de texte que prévu si le texte n'est pas correctement balisé au départ. Il vous faudra outrepasser l'étendue de recherche par défaut en spécifiant une valeur entre parenthèses, par exemple "<head*(100)/head>". L'astérisque n'est pas toujours le premier ou le dernier symbole de la chaîne de recherche située entre guillemets.

L'astérisque garde en mémoire jusqu'à 1 000 caractères. "<div*(100)>" garde en mémoire tous les caractères jusqu'à > et peut les utiliser en remplacement : ainsi, "<div*(100)>" -> "[section *]" renverra [section 1 They Meet Again] si l'élément original comporte <div1 They Meet Again>. "<div*>" produirait les mêmes résultats, mais permet une recherche allant jusqu'à 1 000 caractères pour le signe >.

# # correspond à un nombre, quel qu'il soit. "<div#>" renverra <div1>, <div2> , <div468>, etc. Si le signe # est utilisé dans le remplacement, le même nombre sera utilisé dans le remplacement. Ainsi "<div#>" -> "[section #]" renverra [section 468] si l'original comporte <div468>.

? Le point d'interrogation représente tout caractère simple, sauf l'espace. Il est possible d'utiliser jusqu'à dix ? dans la chaîne de remplacement afin de reproduire le caractère désigné par le ?? dans la chaîne de recherche.

~ Le tilde signifie "sauf". ~"<p>" "<*>" -> "" signifie qu'il faut supprimer tout ce qui se trouve entre crochets, sauf les occurrences de <p>.

{CHR(42)} désigne *, {CHR(35)} désigne #, {CHR(63)} désigne ? et {CHR(126)} désigne ~.

Mot entier, ignorer la casse, confirmer, espaces superflus

/C arrête le processus pour que vous confirmiez, avant de procéder à tout changement, que vous souhaiter continuer.

/W permet d'effectuer une recherche de mot entier (en s'assurant que l'altération n'ait lieu que si un séparateur de mots est présent de chaque côté) (/W "rire" renverra le mot "rire", mais pas "sourire" ni "sourires").

/I effectue une recherche sans tenir compte de la casse (/I "restaurant" -> "hôtel" remplace "restaurant" par "hôtel", RESTAURANT par HÔTEL et Restaurant par Hôtel, en respectant la casse le plus possible).

Il est possible d'effectuer des combinaisons, par exemple

/IWC "the" -> "this"

/S supprime tous les espaces superflus. Il réduit toute séquence de deux espaces ou plus à un seul espace. Il supprime également certains problèmes courants de formatage tel qu'un espace isolé situé après un retour chariot ou avant un signe de ponctuation tel qu'un point ou une virgule. /S peut être utilisé seul sur une ligne ou combiné à d'autres recherches.

Compléments (/A, /T et {v})

/A signifie "ajouter un texte". /A "Ulan" START insère Ulan au début, /A "Bator" END insère Bator à la fin du texte. Consultez le fichier \wsmith4\convert.txt pour en voir une utilisation.

/T signifie ajouter un titre. Ainsi /T "<title>*</title>" -> "*" permet de rechercher <title> … </title> et si l'élément est trouvé, l'expression spécifiée est insérée. Ainsi, votre navigateur affichera le titre dans la barre de titre.

{v="} signifie qu'il faut garder l'élément en mémoire et l'utiliser dans une autre ligne du fichier de conversion lorsque l'élément {v} est trouvé.. "26 Dec." -> "Boxing Day" {v="Xmas"} garde en mémoire la référence Xmas et "1 May" -> "Mayday" {v="after Easter"} stocke after Easter pour qu'il soit utilisé dans une ligne ultérieure telle que "/celebration/" -> "{v}". Supposons que votre texte comporte l'élément 26 Dec. et 1 May. Lorsque l'élément /celebration/ est trouvé, Xmas, est inséré si la mention la plus récente dans le texte est 26 Dec. et after Easter sera inséré si la mention la plus récente dans le texte est 1 May.

Consultez le fichier \wsmith4\convert.txt pour voir des exemples.

Rubriques connexes : Sommaire de Text Converter.