Show/Hide Toolbars

Step-by-step guide to WordSmith
Translation: CK Jung

Navigation: 워드리스트 > 멀티 워드 단위

인덱스 사용하기

Scroll Prev Top Next More

워드스미스를 사용하여 아래와 같은 2개나 3개 단어 뭉치(n-grams)를 만들려면

OF THE

IN THE END

ONCE UPON A TIME

사용자는 먼저 index file을 먼저 만들어야 한다. 참고로 인덱스 파일은 텍스트 파일의 모든 단어 위치를 기록하여 각 단어의 어느 부분에 어떤 단어가 왔는지를 나중에 볼 수 있도록 하는 것이다. 워드스미스에서는 인덱스 파일을 바탕으로 단어 유형을 서로 관련시키는 상호정보 수치를 계산하고, 단어 클러스터를 살펴볼 수도 있다. 또한, 인덱스 파일은 콘그램(Congram) 검색을 생성하기 위해서도 필요하다.

 

참고: making the multi-word unit wordlist