Как найти сходства в двух текстовых файлах?

2570
Dirk

Учитывая два текстовых файла, как я могу найти похожие отрывки? Я знаю, что могу использовать Meld или другой инструмент сравнения, чтобы показать различия, но как сделать обратное?

Например, вот два текста с подчеркнутым сходством:

А) Дружба противопоставляла безрассудство бездарности во введенной литературе им . Он казался энотэ кроме как противостоять весне моей. Между любыми упоминаниями вечернего возраста в ближайшее время возможны регулярные. Ему вскоре шестнадцать полковник вечером сердечно поздравил.

Б) Хорошо рисует беспечность в введенной литературе им . Надежды жили по комнатам ой в доме смерти. Удовлетворенное направление любой может упомянуть вечером, но конец вел себя отлично. Феррар несколько приходов его нисколько не очаровал.

0
Это очень широко ... Например, 2 разных текстовых файла могут содержать знаки препинания ... Что может быть схожим. Вы можете получить столько информации, что ее невозможно будет использовать ... Dave 9 лет назад 0
Добавил пример, но будьте осторожны, это случайный текст. Dirk 9 лет назад 0

1 ответ на вопрос

0
Karel

You can use http://www.copyscape.com/compare.php, which I find quite usefull. All you have to do is post two links or two pieces of text and click "compare items", and the software indicates the corresponding words.