Конвертировать сноски DOCX в HTML или обычный текст?

769
Periphrastic

У меня есть установка Drupal и куча файлов DOCX. Как - несколько лет воскресных проповедей? Я не хочу сохранять 99% форматирования, но у них есть сноски. Меня не особо волнует, как сноски появляются, когда они добавляются в виде контента Drupal, если они действительно появляются. Я нашел несколько конвертеров DOCX-в-HTML, но все они содержат много форматирующих материалов и не имеют возможности отключить то, что я могу найти. Например, LibreOffice, сохраняющий как HTML, сохраняет все виды шрифтов и прочего и превращает все в CSS. Сохранение в виде текста в LibreOffice, похоже, сохраняет номера сносок, но теряет их содержание.

Сохранять такие вещи, как жирный шрифт / курсив, было бы неплохо, но я не хочу поля, шрифты и т. Д., Потому что сайт Drupal имеет свой собственный стиль. Это просто глупые сноски, которые я не могу потерять.

В качестве альтернативы, я думаю, что инструмент для удаления всех дополнительных тегов / стилей также может работать, но я не уверен, существует ли такая вещь.

Спасибо!

0
Вы массово загружаете html-файлы или используете редактор wysiwyg для добавления сообщений с использованием drupal? Если вы используете редактор, некоторые из них имеют специальную функцию «вставить из слова» (например, CkEditor), которая также имеет (можно настроить) флажок «удалить форматирование» для удаления всех тегов docx. horatio 11 лет назад 1
Это действительно сработало! Мы не устанавливали его раньше, но это было достаточно просто, и он импортирует намного более разумно, чем что-либо еще. Periphrastic 11 лет назад 0

0 ответов на вопрос

Похожие вопросы