|
Calcul des informations mutuelles (IM) |
Retour Précédent Suivant |
|
Dans WordList ou Concord
Dans Concord Par défaut, les informations mutuelles ne sont pas calculées pour une liste de co-occurrents. Pour les calculer, il faut une liste de mots qui fournit les données nécessaires. Supposons que vous ayez effectué une concordance de tous les fichiers de c:\wsmith4\text\shakespeare et en particulier du mot amour. Vous obtenez des co-occurents tels que Roméo, haine, le, Juliette, nourrice etc. Leur score IM ou "de relation" est de "??" tant qu'ils ne sont pas calculés. Si ce n'est pas encore fait, utilisez WordList pour créer une liste de mots avec les mêmes fichiers texte (ou un autre corpus de référence). Assurez-vous que vous avez spécifié le bon corpus de référence. Cliquez sur
Dans WordList Pour calculer les informations mutuelles (IM), il vous faut un index WordList. Utilisez l'affichage alphabétique de la liste. Cliquer sur Vous pouvez marquer les éléments pour lesquels vous souhaitez calculer les informations mutuelles (avec
Calculer les scores d'informations mutuelles pour chaque entrée d'un index prend beaucoup de temps, soit plusieurs heures pour un index basé sur 10 millions de mots. Pour l'ensemble du BNC, soit 100 millions de mots, cela peut prendre 24 heures, même avec un ordinateur performant. Pensez à enregistrer vos résultats. Vous avez la possibilité de ne le faire que pour une partie de la liste (par exemple de A à D) et de fusionner ensuite votre liste d'informations mutuelles avec une autre (par exemple de E à H).
Rubriques connexes : Co-occurrents, Mutual Information Settings, Affichage des informations mutuelles, Création d'une liste d'index, Affichage des listes d'index, Sommaire de l'aide de WordList. |