Para fazer uma lista de palavras com sequências de duas, três ou mais palavras (n-grams), como por exemplo
OF THE
IN THE END
ONCE UPON A TIME
etc., terá primeiro de computar um ficheiro de índice, ouindex file. Este reconhecerá basicamente a posição de cada palavra separada no seu corpus.
Veja também: fazer uma lista de sequências de várias palavras
Page url: http://www.lexically.net/wordsmith/step_by_step_Portuguese/?using_an_index.htm