Вам нужно будет использовать регулярные выражения для поиска шаблонов, а затем заменить / переформатировать текст.
Регулярные выражения: http://regular-expressions.mobi/index.html
У меня много библейского текста выглядит
Быт 1: 1. В начале Бог сотворил
небо и землю.
Быт 1: 2 Земля была пуста,
бесформенная масса, покрытая тьмой. И
Дух Божий парил над
его поверхностью.
Быт. 1: 3 Тогда Бог сказал: «Да будет
свет», и был свет.
Быт 1: 4 И увидел Бог, что это хорошо.
Затем он отделил свет от
тьмы.
Я хочу, чтобы каждый стих находился в отдельной строке без отметок ^ p и удаляю стих Book -chapter, который выглядит следующим образом - у меня есть Word 2007-Notepad ++ и PsPad для этого - что будет лучшим способом выглядеть следующим образом
В начале Бог создал небо и землю.
Земля была пуста, бесформенная масса в темноте. И Дух…
Тогда Бог сказал: «Да будет свет», и был свет.
И Бог увидел, что это было хорошо. Затем он отделил свет от тьмы.
Бог назвал свет "днем", а тьму - "ночью". Вместе они составили
Вам нужно будет использовать регулярные выражения для поиска шаблонов, а затем заменить / переформатировать текст.
Регулярные выражения: http://regular-expressions.mobi/index.html
Вы можете сделать несколько трюков с помощью notepad ++.
Перед тем как начать, вы можете сделать резервную копию вашего файла.
Вы можете отформатировать разрывы строк, например, если Вы выделите весь текст и нажмете Ctrl + j, это сделает ваш текст одной строкой.
Пример
ввода:
Gen 1:1 In the beginning God created the heavens and the earth. Gen 1:2 The earth was empty, a formless mass cloaked in darkness. And the Spirit of God was hovering over its surface.
выход:
Gen 1:1 In the beginning God created the heavens and the earth. Gen 1:2 The earth was empty, a formless mass cloaked in darkness. And the Spirit of God was hovering over its surface.
Чем вы можете разбить текст в конце предложений, открыв Поиск> Заменить (горячая клавиша - Ctrl + H ), установив режим поиска на «Расширенный», на «Найти что:» Вы положили: « . », и в «Заменить на:» вы пишете « . \ n », и нажмите заменить все
Пример
ввода:
Gen 1:1 In the beginning God created the heavens and the earth. Gen 1:2 The earth was empty, a formless mass cloaked in darkness. And the Spirit of God was hovering over its surface.
выход:
Gen 1:1 In the beginning God created the heavens and the earth. Gen 1:2 The earth was empty, a formless mass cloaked in darkness. And the Spirit of God was hovering over its surface.
Чтобы избавиться от части 'Gen', все, что вам нужно сделать, это изменить режим поиска на Regular Expression, в «Найти что:» вы пишете «Gen (...)» и «Заменить на:» остается пустым. Нажмите «Заменить все» и:
вход:
Gen 1:1 In the beginning God created the heavens and the earth. Gen 1:2 The earth was empty, a formless mass cloaked in darkness. And the Spirit of God was hovering over its surface.
выход:
In the beginning God created the heavens and the earth. The earth was empty, a formless mass cloaked in darkness. And the Spirit of God was hovering over its surface.
Я живу и дышу этим материалом. Я сканирую и распознаю книги в MOBI все время.
То, что вы хотите, это просто: в вашем любимом инструменте RegEx (мой - EditPlus, потому что я могу сделать это для 200 файлов за один раз), используйте следующее для запуска (игнорируйте начальный пробел):
Replace: ([a-z])\n([a-z]) With: \1 \2
Следующий:
Replace: ^([A-Z])([a-z]+) ([0-9]+):([0-9]+) With: That is, blank.
Вы поняли идею.