Если вы используете pandoc -f html -t markdown_github-raw_html reduced.html -o res.md
его, это решает проблему.
markdown_github
уменьшает набор выходных данных, чтобы игнорировать CSS-raw_html
удаляетraw_html
расширение, которое исправляет ссылки
Я пытаюсь преобразовать HTML-файл в Markdown с помощью Pandoc, но мне трудно найти правильные варианты.
Я хотел бы преобразовать весь HTML-файл в простейшую возможную разметку. То есть без <div>
тегов и CSS-стилей в фигурных скобках. Однако, когда я ввожу следующий HTML-код в pandoc, вызвав pandoc -f html -t markdown reduced.html -o res.md
:
<div class="section-content"> <div class="section-inner sectionLayout--insetColumn"> <h3 name="2ee9" id="2ee9" class="graf graf--h3 graf--leading graf--title">Post Title</h3> <p name="021f" id="021f" class="graf graf--p graf-after--h3">Preamble <a href="https://cogsci.stackexchange.com/users/4397/seanny123?tab=questions" data-href="https://cogsci.stackexchange.com/users/4397/seanny123?tab=questions" class="markup--anchor markup--p-anchor" rel="noopener" target="_blank">link</a> and conclusion.</p> </div>
Я получаю следующий вывод Markdown со всеми вещами, которые я хотел бы игнорировать:
<div class="section-content"> <div class="section-inner sectionLayout--insetColumn"> ### Post Title {#2ee9 .graf .graf--h3 .graf--leading .graf--title name="2ee9"} Preamble [link](https://cogsci.stackexchange.com/users/4397/seanny123?tab=questions){.markup--anchor .markup--p-anchor} and conclusion. </div> </div>
Я попытался прочитать документы Pandoc Markdown, но не смог найти никаких указаний на то, какие параметры мне следует использовать.
Если вы используете pandoc -f html -t markdown_github-raw_html reduced.html -o res.md
его, это решает проблему.
markdown_github
уменьшает набор выходных данных, чтобы игнорировать CSS
-raw_html
удаляет raw_html
расширение, которое исправляет ссылки