Существует фреймворк с открытым исходным кодом transpect
.
Его целью является преобразование полных документов из и в отдельные форматы. ( docx
, TeX, html ...)
Среди прочего, docx
файлы поддерживаются в качестве входных данных:
Если у вас установлен git или svn, вы можете просто следовать этому руководству для базовой настройки:
http://transpect.github.io/getting-started.html
Руководство описывает преобразование всего docx
документа в hub.xml
(в основном docbook + css).
Оба, MathType
и OMML
уравнения переводятся во MathML
время преобразования.
Вы можете просто извлечь mml:math
элементы из hub.xml
, используя любой инструмент, который вам нравится.
Существуют и другие модули Transpect, чтобы полностью преобразовать hub.xml
нужный формат.
Это требует больше времени для настройки, так что это зависит от того, что вы собираетесь делать с результатами.
Фон
Был создан старый редактор формул Word MathType
.
Новый редактор формул Word основан на OMML
.
A MathType
-Equation отображается в виде изображения в Word.
Если вы MathType
установили, откроется отдельное окно, если вы нажмете, чтобы изменить уравнение.
Иначе, вы не можете редактировать это.
Новые уравнения ( OMML
) можно редактировать непосредственно в программном обеспечении Word.
OMML
и MathML
оба являются XML-форматами.
omml2mml.xsl
это файл, предоставленный Microsoft для перехода OMML
на MathML
.
transpect
использует модифицированный вариант этого, потому что исходный файл имеет несколько недостатков.
(Там также существует mml2omml.xsl
, чтобы перейти MathML
к OMML
)
MathType
использует не-XML-структуру для своих уравнений.
MathType
можно импортировать MathML
уравнения, но нет OMML
.
MathType
поэтому требует, чтобы omml2mml.xsl
файл генерировался MathML
первым.
Кстати, MathType
не всегда сохраняются стили символов (полужирный / курсив) при экспорте в MathML / TeX.
Поддерживать все типы уравнений в Word и повышать производительность преобразования transpect
можно переводить MathType
в MathML
.
Для вашей информации: я участник проекта transpect .