Per creare una lista di parole con coppie o triplette di parole (n-gram) come
OF THE
IN THE END
ONCE UPON A TIME
ecc. per prima cosa hai bisogno di elaborare un file indice. Questo file essenzialmente conosce la posizione di ogni singola parola nel corpus.
Vedi anche: creare la lista di parole con unità multiparola