Einzelne Wörter vs. Cluster

Top  Previous  Next

 

Wozu dient das?

Cluster sind Wörter, die wiederholt gemeinsam aufeinander folgend auftreten. Ihre Beziehung ist enger als bei Kollokationen, eher wie bei Komposita, Wortgruppen oder Phrasen. (Hier werden sie Cluster genannt, weil Gruppen und Phrasen bereits grammatikalisch definiert sind. Wenn solche Wörter mit einem Softwareprogramm gefunden werden, sind sie nicht automatisch fixierte, aus mehreren Wörtern bestehende Einheiten.) Biber nennt sie "lexical bundles" (dt. 'lexikalische Bündel').

Sprache besteht aus Phrasen und Text. Dabei es nicht hilfreich, Sprache als eine Frage der Auswahl eines Worts für eine grammatikalische Lücke zu betrachten, wie strukturalistische Theorien behaupten. Wörter stehen miteinander in Kontakt: Im Extremfall der Idiome sind sie eng aneinander gebunden, aber alle Wörter tendieren dazu, sich mit anderen Wörtern zu gruppieren. Diese Beziehungen sind möglicherweise grammatikalische Kollokationen (z. B. die Beziehung zwischen abhängig und von), Kollokationen oder semantische Prosodie (die Tendenz, dass das Wort verursachen meist mit negativen Wörtern wie Problem, Unfall, etc. auftritt).

Oxford WordSmith Tools bietet zwei Möglichkeiten Wortcluster zu identfizieren, und zwar in WordList und in Concord. Dabei werden verschiedene Methoden angewandt.  In Concord werden nur Konkordanzzeilen verarbeitet, in WordList ganze Texte.

 

Wie funktioniert das in Concord?

Angenommen, Ihr Text beginnt etwa folgendermaßen:

Once upon a time, there was a beautiful princess. She snored. But the prince didn't.

Wenn Sie 2-Wort-Cluster gewählt haben, wird der Text wie folgt aufgeteilt:

Once upon

upon a

a time

(nicht " time there" aufgrund des Kommas!)

there was (etc.)

Wenn Sie 3-Wort-Cluster gewählt haben:

Once upon a

upon a time

there was a

was a beautiful

a beautiful princess

But the prince

the prince didn't

(etc.)

Also wird jeder N-Wort-Cluster gespeichert, wenn er eine Länge von N Wörtern erreicht. Cluster können nicht über Interpunktionsgrenzen (;,.!?) hinausgehen. (Interpunktionszeichen markieren Satzgrenzen, und es erscheint sinnvoll, dass Cluster nicht über Satzgrenzen hinausgehen dürfen.)