Программное обеспечение автоматического анализа содержимого PDF-файлов

561
iceman

Существует ли программное обеспечение с открытым исходным кодом / коммерческое программное обеспечение, которое может выполнять автоматический анализ содержимого (для создания желательных резюме) в большой коллекции документов PDF, которые помечены метаданными для легкой классификации? Какую технологию использует Google для анализа размещенных в Интернете PDF-файлов и их ранжирования?

1

1 ответ на вопрос

0
AffineMesh

Я не уверен, что использует Google, но возможно читать и создавать документы PDF на стороне сервера с программным компонентом, таким как ABCpdf.NET. Это требует определенных знаний программирования на ASP или ASP.NET (страницы активных серверов) для серверов Microsoft IIS или PHP для веб-серверов Apache.

Я ищу что-то, что делает интеллектуальный анализ текста в обширной базе данных PDF-файлов. Это может быть настольное приложение / скрипты и т. Д. Google может анализировать множество различных форматов файлов и искать текстовый контент. iceman 14 лет назад 0

Похожие вопросы