Сохранение веб-страниц в Firefox в виде текстовых или RTF-файлов с сохранением базового форматирования и позиционирования

873
RockPaperLizard

Возможно ли в Firefox сохранять страницы, содержащие текст, сохраняя основное форматирование и позиционирование, но не сохраняя исполняемый код (JavaScript)?

Это не должно быть идеально, просто близкое приближение.

Мне нужен текст для поиска, поэтому снимок экрана будет недостаточным.

Ответы, которые относятся к Windows, являются предпочтительными.

Что я пробовал:

  1. Скопируйте и вставьте в блокнот.
    Результат: потерял все форматирование и позиционирование текста (как и ожидалось).
  2. Скопируйте и вставьте в OpenOffice, LibreOffice и Wordpad.
    Результат: не поддерживается достаточное позиционирование текста. В частности, текст с выравниванием по левому и правому краю стал выравниваться по левому краю.
  3. Сохранить как текстовый файл из Firefox.
    Результат: такой же как # 1.
  4. Сохранить как HTML-файл из Firefox.
    Результат: такой же, как # 2.
  5. Сохранить как полный HTML-файл из Firefox.
    Результат: по какой-либо причине Firefox сообщает о сбое для многих страниц, возможно, из-за того, что страницы обслуживаются через HTTPS.

Мой текущий обходной путь - это PITA. Я загружаю HTML страницы и любой CSS. Затем я вручную редактирую каждый файл HTML, чтобы он указывал на локальную копию файлов CSS. Наконец, я удаляю все ссылки JavaScript. Это требует значительного количества времени и усилий и приводит к зависимости от файлов CSS, а не от одного чистого текста или файла RTF.

Я рассмотрел расширение формата архива Mozilla, но думаю, что оно всегда сохраняет весь JavaScript в архиве. Я предпочитаю простой текстовый или RTF (форматированный текст) файл без зависимостей и определенно без JavaScript.

0
Я считаю, что обычный процесс - это выполнять ручную работу. Сожалею. Я думаю, вы не увидите очень удовлетворительного ответа. Однако как удалить все ссылки JavaScript? Это должно быть достаточно автоматизировано. Например, замените теги. Мне не нравится хранить все CSS-файлы, поэтому я иногда копирую и вставляю важные стили CSS в HTML, чтобы применять их напрямую. Это довольно много времени. Вырезание и вставка в текстовый процессор очень близки, но потеря выравнивания по левому и правому краям приводит к потере важного позиционирования, особенно для транскрипции текста. TOOGAM 8 лет назад 0
@TOOGAM Да, я делаю такие изменения или просто редактирую все теги ` `. Мне не нравится хранить все CSS-файлы, поэтому я иногда копирую и вставляю важные стили CSS в HTML, чтобы применять их напрямую. Это довольно много времени. Вырезание и вставка в текстовый процессор очень близки, но потеря выравнивания по левому и правому краям приводит к потере важного позиционирования, особенно для транскрипции текста. RockPaperLizard 8 лет назад 0
Ты используешь Firefox? Можете ли вы использовать другой веб-скребок, например, cURL? TOOGAM 8 лет назад 0
@TOOGAM Хороший вопрос. Я настоятельно предпочитаю Firefox, но он не должен использовать его. Просто, чтобы уточнить, у меня есть эта потребность только для случайных веб-страниц (обычно 1-5 в день), и мне просто нужен текст на одной странице (мне не нужно чистить весь сайт или что-то еще). Страницы, как правило, обслуживаются через HTTPS. Я обычно нахожусь в коробке Windows, когда мне нужно сделать это. RockPaperLizard 8 лет назад 0

0 ответов на вопрос