Анализ ключевых слов в Microsoft Office

1096
mmcglynn

Существует ли какое-либо программное обеспечение, которое будет выполнять анализ ключевых слов для пакета файлов Microsoft Word? Другими словами, я просто хотел бы подсчитать все используемые слова. Цель состоит в том, чтобы определить ключевые слова в качестве основы для создания таксономии.

0
Это очень открытый: какой тип анализа вы хотели? Clare Macrae 13 лет назад 0
обновленный вопрос, чтобы быть более конкретным. mmcglynn 13 лет назад 0
Возможный дубликат: http://superuser.com/questions/251324/list-and-count-unique-words-from-a-word-document fixer1234 8 лет назад 0

2 ответа на вопрос

1
Simon

Я использую скрипт Python, который использует docx.pyмодуль (см. Здесь ), чтобы читать файлы Word и обрабатывать отдельные слова для связанной задачи. Ключевые биты находятся в следующем коде (который читает только один файл .docx, заданный в качестве первого аргумента командной строки, но может быть легко расширен для подсчета слов во многих файлах:

from docx import * import sys  try: document = opendocx(sys.argv[1]) except: print('Could not open '+sys.argv[1]) exit()  ## Fetch all the text out of the document  paratextlist = getdocumenttext(document)   count = {} for line in paratextlist: for word in line.rstrip().split(): count = count.get(word,0) + 1 
0
rlb.usa

Как насчет WordStat ?

Абсолютно верно. Вполне дорогой, хотя в ~ $ 3000. mmcglynn 13 лет назад 0

Похожие вопросы