Sélectionner un fichier de correspondance de lemmes

Retour  Précédent  Suivant

 

Le but

Vous pouvez lemmatiser tous les éléments de la liste de mots courante en utilisant un fichier texte standard regroupant tous les mots qui vont ensemble (être -> était, est, étaient etc). Créer le fichier texte prend du temps, mais il est très utile pour lemmatiser de nombreuses liste de mots et est moins aléatoire que le regroupement automatique.

 

Procédure

Dans le contrôleur principal, Paramètres | Modifier les paramètres | Listes, l'écran suivant s'affiche :

 

choose_lemma_or_match_or_stop_file

 

Cliquez sur le bouton approprié (pour Concord, KeyWords ou WordList) et saisissez le nom du fichier ou utilisez parcourir pour le sélectionner.

 

Ce fichier contient une liste de lemmes au format texte brut, avec des éléments tels que :

 

ÊTRE -> SUIS, SONT, ÉTAIT, ÉTAIENT, EST

ALLER -> VA, VONT, ALLA, ALLÈRENT

 

Le contrôleur lit les fichiers et affiche les lemmes (ou un échantillon si la liste est trop longue).

 

Le calcul des listes a lieu lorsque vous cliquez sur l'option de menu Faire correspondre les lemmes(LEMMAS) dans WordList, Concord ou KeyWords. Pour des explications plus complètes avec des captures d'écran, reportez-vous à la section Liste de correspondance.

 

Que se passe-t-il si mes fichiers texte ne contiennent pas ÊTRE ?

Supposons que vous fassiez correspondre SUIS, SONT etc. avec ÊTRE comme dans la liste ci-dessus, et que vos texte ne contiennent pas le mot ÊTRE. WordList ne le trouvera donc pas.  Pour y remédier, il faut créer une nouvelle liste de mots à partir d'un fichier de texte brut (dans lequel vous incluez ÊTRE ainsi que les autres formes infinitives désirées), l'enregistrer, et le fusionner avec votre liste de mots. WordList trouve alors la forme ÊTRE et l'ajoute à SUIS, SONT, ÉTAIENT, etc.

 

 

Rubriques connexes : Lemmatisation, Liste de correspondance, Liste d'arrêt