Как подсчитать количество символов в многочисленных комментариях к файлу MS Word 2007?

257
CopperKettle

Мне было дано задание перевести все комментарии в большой файл MS Word. Чтобы составить счет, мне нужно подсчитать все символы (включая пустые места) во всех исходных комментариях «пузыри». Теперь, как это сделать? Ручной подсчет будет сложно.

Можно ли как-то сохранить все комментарии в отдельном текстовом файле, чтобы посчитать их?

PS Я только что попытался сохранить документ DOC как файл MHT. Все комментарии отображаются аккуратно внизу страницы. Я могу выбрать их все и щелкнуть правой кнопкой мыши «Копировать». Но когда я открываю новый документ MS Word и нажимаю «вставить», ничего не происходит.

0

1 ответ на вопрос

1
jhilmer

Файл docx представляет собой zip-архив с несколькими xml-файлами. Одним из таких файлов является comments.xml, который содержит все комментарии. В моей системе Linux я сделал следующее, чтобы извлечь текст всех комментариев. Я сделал простой файл test.docx с абзацем, к которому я прикрепил комментарий.

unzip test.docx  xmllint --xpath "//*[local-name()='t']/text()" word/comments.xml  

Которые возвращают весь текст комментариев. Здесь и далее это просто число символов / слов.