Om een woordenlijst te maken met groepen van twee of van drie woorden (n-grams) zoals
OF THE
IN THE END
ONCE UPON A TIME
etc moet je eerst een index bestand maken: een index file. Dit bestand weet de positie van elk individueel woord in je corpus.
Zie ook : het maken van een multi-woord eenheid woordenlijst