Anfang und Ende von Textsegmenten

Top  Previous  Next

 

WordSmith versucht vier Arten von Textsegmenten zu erkennen: Sätze, Absätze, Überschriften und Abschnitte. Bei der Verarbeitung werden Groß- und Kleinschreibung beachtet. Sie können in den Texten die Tags <Enter> und <Tab> verwenden, um das Ende eines Absatzes oder einen Tabstopp zu markieren. Für Satzenden ist auto eine weitere Option.

 

Sätze

Zum Beispiel <s> kann den Anfang eines Satzes markieren und </s> das Ende. Wenn Sie die Auswahl bei auto belassen, werden Satzenden anhand der Interpunktionszeichen .!? gefolgt von einem Großbuchstaben bestimmt.

 

Absätze

Zum Beispiel <p *> oder <p> markiert den Anfang eines Absatzes und </p> das Ende.

 

Überschriften

Zum Beispiel <head> markiert den Anfang einer Überschrift und </head> das Ende. Beachten Sie bitte, dass der British National Corpus Sätze innerhalb von Überschriften markiert; z. B.

<head>

<s n="2"><w NN1>Introduction

</head>

im Text HXL. Es ist erscheint ungewöhnlich, das einzelne Wort Introduction als Satz zu werten, weshalb WordSmith innerhalb von Überschriften keine Satz-Tags verwendet.

 

Abschnitte

Zum Beispiel <section *> markiert den Anfang eines Abschnitts und </section> das Ende.

 

Jedes dieser Tags wird gezählt, vorzugsweise wenn das Endtag, wie z. B. </s>, </p>, etc., vorhanden ist. Wenn im gesamten Text keine schließenden </p>-Tags vorkommen, werden Absätze jedes Mal gezählt, wenn das öffnende Tag gefunden wird.

 

 

Siehe auch: Tag-Übersicht, Tag-Handling, Nächstes Tags in Concord anzeigen, Tag-Konkordanz erstellen, Tagtypen, Tags anzeigen, Tags als Selektoren verwenden