|
Listes d'arrêt |
Retour Précédent Suivant |
|
Les listes d'arrêt sont des listes de mots qui ne doivent pas être inclus dans votre analyse. Il peut s'agir par exemple de mots très courants sans grand intérêt comme le, de, était, est, ce que vous souhaitez exclure d'une liste de mots ou d'une analyse de mots-clés.
Pour utiliser les listes d'arrêt, vous devez avoir créé un fichier avec le bloc-notes ou tout autre logiciel de traitement de texte, indiquant tous les mots à ignorer. Il faut séparer les mots par des virgules ou aller à la ligne pour chaque mot. Vous pouvez utiliser des majuscules ou des minuscules. Vous pouvez utiliser un point-virgule pour les lignes de commentaires. Vous trouverez un fichier stoplist.stp (dans le dossier \wsmith4) que vous pouvez utiliser comme base et enregistrer sous un nouveau nom.
Exemple
; commentaire LE,CE,EST IT WILL
Sélectionnez ensuite Liste d'arrêt dans le menu pour spécifier la liste d'arrêt à utiliser. Vous pouvez utiliser des listes d'arrêt différentes pour WordList et KeyWords. Si la liste d'arrêt est activée, les mots qui s'y trouvent ne seront plus intégrés à une liste de mots. Pour utiliser toujours la même liste d'arrêt, indiquez-le dans le fichier wshell.ini comme paramètre par défaut.
Pour des explications plus complètes avec des captures d'écran, reportez-vous à la section Liste de correspondance.
Pour créer une liste d'arrêt, vous pouvez également utiliser WordList sur un gros corpus de textes, en indiquant une fréquence minimum élevée si vous ne souhaitez que les mots à haute fréquence. Enregistrez ensuite au format texte. Utilisez ensuite Text Converter pour le formater avecstoplist.cod comme fichier de conversion.
Rubriques connexes : Création d'un fichier de balises, Liste de correspondance, Lemmatisation. |