|
Début et fin des segments de texte |
Retour Précédent Suivant |
|
WordSmith sait reconnaître 4 types de segments au sein d'un texte : phrases, paragraphes, en-têtes et sections. Attention, ce processus est sensible à la casse. Vous pouvez utiliser <Entrée> et <Tab> pour représenter la fin d'un paragraphe ou une tabulation dans vos textes. Pour les fins de phrases, vous pouvez également utiliser l'option auto.
Phrases On peut avoir par exemple <s> pour indiquer le début d'une phrase et </s> pour la fin. Si vous conservez l'option auto, les fins de phrase sont déterminées par les points finaux, d'interrogation ou d'exclamation suivis d'une lettre majuscule.
Paragraphes <p *> ou <p> peuvent marquer le début d'un paragraphe et </p> la fin, par exemple.
En-têtes On peut avoir par exemple <head> pour indiquer le début et </head> pour la fin. Remarque : le British National Corpus marque les phrases avec des en-têtes. Par exemple : <head> <s n="2"><w NN1>Introduction </head> dans du texte HXL. Il ne serait pas utile de considérer Introduction comme une phrase, WordSmith ignore donc les balises de phrases au sein des en-têtes.
Sections Par exemple, <section *> peut marquer le début et </section> la fin.
Ces différents types de segments sont comptabilisés à chaque fois qu'une balise de fin comme </s>, </p>, etc. apparaît dans le texte. Si le texte ne comporte aucune balise de fin </p>, les paragraphes seront comptés à chaque fois qu'une balise d'ouverture de paragraphe est trouvée.
Rubriques connexes : Présentation générale des balises, Gestion des balises, Affichage des balises les plus proches dans Concord, Concordance des balises, Types de balises, Affichage des balises, Utilisation des balises comme sélecteurs de texte
|