|
Texte nach Inhalt filtern |
Top Previous Next |
|
Wozu dient das? Möglicherweise möchten Sie eine große Textsammlung nach Reden von Männern über 60, nach Werbematerial oder nach Unterrichtsdialogen filtern. Mit dieser Funktion durchsucht WordSmith jeden einzelnen Text nach bestimmten Wörtern oder Zeichen, sodass Sie am Schluss die richtigen Textdateien erhalten und alle irrelevanten Textdateien ignoriert werden.
Angenommen Sie haben eine große Textsammlung (z. B. den British National Corpus, BNC) und Sie wissen nicht mehr, welche der Dateien gesprochene Texte von Männern über 60 enthalten.
Da der BNC das Tag stext> für gesprochenen Text verwendet, sex=m für männliche Sprecher, und age=5 für Sprecher ab 60, können Sie mit WordSmith so Ihre Textsammlung filtern. WordSmith durchsucht dann den gesamten Inhalt jeder Textdatei (nicht nur Tags oder Überschriften, sondern den Inhalt der ersten zwei Megabyte der Datei) und überprüft, ob die Datei Ihren Anforderungen entspricht.
Sie können bis zu zwölf Tags festlegen, jedes bis zu einer Länge von 80 Zeichen. Dabei wird Groß- und Kleinschreibung berücksichtigt (d. h. Sie werden keine Treffer haben, wenn Sie z.B. aus Versehen Age=5 eingeben) Horizontal stehen die Optionen für Kombinationen, die mit "oder" verknüpft sind. Vertikal sind die Kombinationen mit "und" verknüpft. Die untere Gruppe steht für Kombinationen, die mit "nicht" verknüpft sind. Nachdem die Textdateien verarbeitet wurden, können Sie in dem Fenster "Textdatei auswählen" die Dateien sehen, die Ihren Anforderungen entsprechen und die Liste für den späteren Gebraucht unter Favoriten speichern.
Beispiele: Sie suchen Dateien, die sowohl das Wort Katzen als auch das Wort Hunde enthalten: Geben Sie Katzen in das erste Feld ein, und Hunde in das Feld darunter. Sie suchen Texte, die das Wort Blumen enthalten, sowie entweder das Wort Rosen oder das Wort Veilchen: Geben Sie Rosen und Veilchen nebeneinander in ersten zwei Felder ein. Geben Sie dann Blumen in der nächsten Zeile in dem Feld ganz links ein. Sie suchen nach englischen Texten, in denen entweder das Wort book oder das Wort hotel vorkommen, aber weder das Wort publish noch das Wort Booker Prize vorkommen: Geben Sie dazu in dem ersten Feld book ein, in dem Feld rechts daneben hotel, und in den ersten zwei Feldern in der untersten Zeile publish* und Booker* ein.
Siehe auch: Tags als Selektoren, Innerhalb von Texten auswählen, Textdateien mit Text Converter filtern.
|