|
Création d'une liste d'index |
Retour Précédent Suivant |
|
Pour créer un index, utilisez le contrôleur et cliquez sur Modifier les paramètres | Index. Vous devez spécifier un nom de fichier pour l'index.
WordList parcourt ensuite les textes que vous avez sélectionnés et garde en mémoire les informations relatives à la position de chaque exemple de chaque type de mots.
fichiers d'index Deux fichiers sont créés pour chaque index : fichier .tok : gros fichier contenant les informations relatives à la position de chaque unité lexicale d'un mot dans vos fichiers texte. fichier .typ : connaît tous les types de mots.
Un index permet de calculer les clusters de mots et les scores des information mutuelles pour chaque type de mots. La capture d'écran ci-dessous montre les barres de progression pour un index du BNC World corpus. Il a fallu près d'une heure pour effectuer 96% du travail, à un taux de 1,8 millions de mots par minute. Le fichier BNC Words.tok qui en résulte pèse 1,6 Go et le fichier BNC Words.typ pèse 26 Mo.
ajouter à un index Pour ajouter à un index existant, sélectionnez simplement quelques textes supplémentaires et cliquez sur Fichier | Nouveau | Index. Si le nom de fichier est déjà utilisé par un autre index, vous devrez indiquer si vous souhaitez y ajouter des données ("Oui") ou recommencer ("Non").
Rubriques connexes : Utilisation des listes d'index, Affichage des listes d'index, Sommaire de l'aide de WordList. |