Конвертировать веб-страницы в один файл для электронной книги

26109
Hrvoje Hudo

Я хочу загрузить HTML-файлы (пример: http://www.brpreiss.com/books/opus6/ ) и присоединить их к одному HTML-формату или другому формату, который я могу использовать для чтения электронных книг. Сайты с бесплатными книгами не имеют стандартной подкачки страниц, они не блоги или форумы, поэтому не знаете, как выполнить автоматический обход и объединение.

21

5 ответов на вопрос

13
Mr Alpha

Вы можете использовать Caliber для конвертации ваших электронных книг. Вы можете сделать это, чтобы создать одну книгу из нескольких HTML-файлов, связавшись с ними из одного HTML-файла, который вы настроили как оглавление, подобное этому .

Я использую Sigil для преобразования в EPUB, но не знал, что Cailbre может сделать одну книгу из нескольких связанных htmls. Я постараюсь, спасибо! Hrvoje Hudo 13 лет назад 0
Вы можете использовать http://www.httrack.com/ для загрузки веб-страниц, а затем использовать Caliber для преобразования их всех в формат ePub. 에이바 13 лет назад 1
Мой процесс (с использованием Chrome) - использовать букмарклет Instapaper Text, чтобы немного очистить вещи, затем щелкнуть правой кнопкой мыши -> Сохранить как, выбрать сохранить как одну веб-страницу, только HTML, затем открыть это в Caliber, преобразовать в EPub, затем используйте функциональность «Редактировать книгу», чтобы привести в порядок любые дополнительные беспорядочные разметки, которые будут вставлены. El Yobo 9 лет назад 3
5
HaroldT

То, как я делал это, было Caliber.

Это стало слишком большой болью, поэтому я создал Chrome Extension, чтобы упростить его.

Это называется EpubPress ( http://epub.press ).

Это позволяет создавать электронные книги из вкладок Chrome.

Надеюсь, это поможет!

Веб-сайт по вашей ссылке предполагает, что упаковка происходит на стороннем сервере, конфиденциальность НЕ гарантируется этим методом. Burgi 8 лет назад 2
У вас есть предложения по изменениям, которые помогут вам чувствовать себя в большей безопасности? Я приложил все усилия, чтобы требовать только минимальную информацию для создания книги, но я открыт для дальнейших отзывов. Если вы посмотрите на любой аналогичный сервис, вы обнаружите, что любой контент, который вы хотите сохранить, отправляется на сервер. Разница в том, что этим службам также требуется учетная запись и весь контент связан с вашим именем. Они также не предоставляют исходный код для своих сайтов, чтобы вы могли видеть, что они собирают. Это расширение с открытым исходным кодом, и я с удовольствием отвечу на любые вопросы по поводу этого кода. HaroldT 8 лет назад 0
Какой отличный инструмент! Большое спасибо за бесплатное предоставление сообществу! vonjd 6 лет назад 0
4
ananth.p

Pandoc может взять ссылку на страницу (или HTML-файл) и преобразовать ее в pdf / epub ...

Я не уверен, что это будет ползти. Если этого не произойдет, вы можете сначала сканировать страницы с помощью wget или чего-то еще (или просто собирать ссылки) и передавать их pandoc.

в соответствии с man-страницей, он будет: «Вместо файла может быть задан абсолютный URI. В этом случае pandoc будет извлекать контент, используя HTTP» jopasserat 7 лет назад 0
0
gagarine

Вы можете использовать https://getpocket.com и карманный рецепт калибра, доступный через меню «Получить новости».

0
str8arrow

HTTrack является хорошим вариантом - он будет создавать электронную книгу с веб-сайта: ее можно скачать здесь: https://www.httrack.com/ HTTrack "позволяет загружать сайт World Wide Web из Интернета на локальный сайт. каталог, рекурсивно создавая все каталоги, передавая HTML, изображения и другие файлы с сервера на ваш компьютер. HTTrack организует относительную структуру ссылок исходного сайта. "

Затем вы можете конвертировать HTML в EPUB, AZW3 или PDF с помощью Caliber или любого другого программного обеспечения для конвертации HTML в epub.

Второй вариант для прямого преобразования в EPUB - это EpubPress: он имеет расширения, позволяющие использовать Firefox (только v44.0 +) или Chrome. Чтобы использовать это программное обеспечение, вам нужно открыть окно браузера. Каждая вкладка - это, по сути, «глава» в вашей электронной книге. Расположите вкладки в нужном порядке появления, затем активируйте epubpress - он загрузит и расположит вкладки в порядке их появления в формате .epub. Надеюсь это поможет!

* Тем не менее, обратите внимание, что EpubPress загружает отдельные веб-страницы, а не «веб-сайт», как делает HTTrack. Чтобы загрузить веб-сайт с EpubPress, вы должны открыть каждую ссылку на веб-сайте в виде отдельной вкладки, а затем использовать Epubpress для сбора этих ссылок в формате .epub.