Как преобразовать файл CHM в один файл HTML?

1326
expert

Я пробовал много разных утилит CHM-to-HTML, но мне трудно найти одну, способную создать один HTML-файл. Я могу декомпилировать файл CHM с помощью hh.exe, но я не знаю, как легко объединить полученные файлы в один файл HTML, сохраняя при этом правильный порядок страниц.

Есть ли бесплатный инструмент, который может сделать это? Если нет, как я могу объединить файлы HTML по порядку?

2
Вы пробовали какие-либо другие утилиты? Не зная, ответы на ваш вопрос также могут быть получены непосредственно из быстрого [search] (http://google.com/search?q=convert+chm+to+html). iglvzx 12 лет назад 0
Я перепробовал много утилит. Какой ** вы ** порекомендуете? expert 12 лет назад 0
Только что попробовал инструмент от Gridinsoft по вашей ссылке. Не работает expert 12 лет назад 0
На самом деле я уже потратил 3 часа на установку и пробовал всю возможную хрень. Ни один из них не работает должным образом. Вот почему я пришел сюда :) expert 12 лет назад 0
Хорошо. Таким образом, мы можем сделать вывод, что создание одного HTML-файла не является стандартной функцией такого программного обеспечения (или, по крайней мере, свободного программного обеспечения). iglvzx 12 лет назад 0
Так что у вас нет рекомендаций. Благодарю. expert 12 лет назад 0
Нет, к сожалению. Я отредактировал ваше сообщение, чтобы отразить наше обсуждение, поэтому этот вопрос не должен закрываться как рекомендация продукта. iglvzx 12 лет назад 1

1 ответ на вопрос

0
Marco van de Voort

Html-архив состоит из набора html-страниц со связанным носителем (читай: изображения и простой javascript).

CHM имеет указание, какая страница является «главной» страницей, которая обычно является некоторой обзорной страницей. Кроме того, он имеет оглавление (TOC), которое представляет собой дерево узлов, указывающих на HTML-файлы. Прогулка по дереву дала бы более или менее линейный порядок.

Но страница по умолчанию может не быть первой страницей оглавления или вообще в оглавлении, и не все страницы могут быть в оглавлении. В этом случае нет порядка, который можно было бы обнаружить с помощью автоматических средств.

Извлечение CHM с помощью общего инструмента декомпиляции даст вам кучу htmls, .hhk и .hhc. .Hhc - это оглавление в форме XML. Hhk - это индекс, но он вам сейчас не нужен. Страница по умолчанию находится во внутреннем файле и обычно не видна после извлечения (используйте свойства инструментов chm)

Помимо определения порядка, существует собственно само слияние. Это может быть сложно, но практические обходные пути могут быть импортировать их в офис с помощью некоторых сценариев.

Я думаю, что способный сценарист мог бы осуществить это, но это не тривиально.