Я не уверен, что использует Google, но возможно читать и создавать документы PDF на стороне сервера с программным компонентом, таким как ABCpdf.NET. Это требует определенных знаний программирования на ASP или ASP.NET (страницы активных серверов) для серверов Microsoft IIS или PHP для веб-серверов Apache.
Программное обеспечение автоматического анализа содержимого PDF-файлов
561
iceman
Существует ли программное обеспечение с открытым исходным кодом / коммерческое программное обеспечение, которое может выполнять автоматический анализ содержимого (для создания желательных резюме) в большой коллекции документов PDF, которые помечены метаданными для легкой классификации? Какую технологию использует Google для анализа размещенных в Интернете PDF-файлов и их ранжирования?
1 ответ на вопрос
0
AffineMesh
Я ищу что-то, что делает интеллектуальный анализ текста в обширной базе данных PDF-файлов. Это может быть настольное приложение / скрипты и т. Д. Google может анализировать множество различных форматов файлов и искать текстовый контент.
iceman 14 лет назад
0
Похожие вопросы
-
3
Автоматически заполнять метаданные песен в OS X
-
2
iTunes: получение обновленных метаданных на iPod при использовании ручного управления
-
11
Как мне пакетно изменить дату получения информации в данных EXIF?
-
-
1
где предпринимаются усилия по стандартизации метаданных целостности загрузки? (Appcasting?)
-
4
Изменение даты файла изображения
-
2
Что такое хороший инструмент для очистки метаданных из файлов?
-
1
Почему версия Bing для США лучше, чем версии для других языков?
-
3
Есть ли в Bing операторы расширенного поиска?
-
2
Инструмент для просмотра видео / аудио файлов
-
3
Какая поисковая система по умолчанию будет в Windows 7?