Transinformation (MI) berechnen

Top  Previous  Next

 

In WordList oder in Concord

 

In Concord

Die Transinformation (MI für engl. "Mutual Information") wird nicht standardmäßig für eine Kollokatorenliste berechnet. Zur Berechnung des MI benötigen Sie eine Wortliste, um die relevanten Daten zu Verfügung zu stellen.

Angenommen Sie haben eine Konkordanz erstellt mit allen Dateien in c:\wsmith4\text\shakespeare und dem Suchwort love. Sie erhalten Kollokatoren wie Romeo, hate, the, Juliet, Nurse, etc. Alle diese Kollokatoren zeigen einen "Relationswert" (MI-Wert) von "??" an, da der Wert noch nicht berechnet wurde.

Wenn Sie den Wert noch nicht berechnet haben, erstellen Sie mit WordList eine Wortliste derselben Textdateien (oder eines anderen Referenzkorpus, wenn Sie das bevorzugen). Stellen Sie sicher, dass Sie die Wortliste tatsächlich basierend auf dem Referenzkorpus erstellen möchten.

Wählen Sie nun das Menüelement mutuali und Concord verwendet den Dateinamen des Referenzkorpus. Jeder der Kollokatoren wird nachgeschlagen und der MI-Wert anhand der Informationen im Referenzkorpus berechnet.

 

In WordList

Um die Transinformation (MI) zu berechnen, benötigen Sie einen WordList-Index. Rufen Sie die alphabetische Ansicht der Liste auf.

Wenn Sie mutuali anklicken, können Sie auswählen, ob Sie den MI-Wert für die ausgewählten (markierten) Einträge berechnen möchten, für alle Einträge, oder nur für Einträge zwischen zwei bestimmten Anfangsbuchstaben, z. B. von A bis D.

Wenn Sie nur ein paar Elemente für die MI-Berechnung auswählen möchten, können Sie diese zuerst markieren (mit MARK).

 

Den MI-Wert für jeden einzelnen Eintrag eines Index zu berechnet, dauert ziemlich lange: zumindest ein paar Stunden im Fall eines Index basierend auf 10 Millionen Wörtern. Es dauert etwa 24 Stunden, um den gesamten BNC, ca. 100 Millionen Wörter, zu verarbeiten, auch auf einem modernen, leistungsstarken PC. Vergessen Sie nicht, die Ergebnisse nach dem Vorgang zu speichern! Sie können immer Teile der Liste berechnen (z. B. A bis D) und später Ihre Transinformationsliste mit einer anderen Transinformationsliste (z. B. E bis H) zusammenführen.

 

Siehe auch: Kollokatoren, Transinformationseinstellungen, Transinformation: Anzeige, Indexliste erstellen, Indexlisten anzeigen, Inhalt der WordList-Hilfe.