Поиск страниц на веб-странице, содержащей определенную ссылку

406
Norfeldt

Google делает хорошую работу по поиску соответствующей информации.

Скажем, я Google: мнение FDA по ISO-9001

Затем он находит ссылку на PDF-файл на сайте fda.gov http://www.fda.gov/downloads/MedicalDevices/DeviceRegulationandGuidance/PostmarketRequirements/QualitySystemsRegulations/UCM134625.pdf.

Но как мне найти страницу на fda.gov, которая на самом деле ссылается на этот .pdf?

Таким образом, я могу видеть, в каких отношениях это было опубликовано FDA (сам документ не содержит много информации о том, когда и кому он был опубликован).

3

1 ответ на вопрос

1
Hastur

Если я хорошо помню, есть link:команда, которую вы можете написать на странице Google [ 1 ] :

link: www.yoursite/path/to/yourfile.pdf 

Ссылается [ 2 ], что с info: siteвами можно получить страницы, которые ссылаются на сайт.

информация : Получить информацию о веб-адресе, включая кэшированную версию страницы, похожие страницы и страницы, которые ссылаются на сайт. Пример: info: google.com

ОБНОВИТЬ:

Специально для вашей ссылки я написал в гугле

link: www.fda.gov/downloads/MedicalDevices/DeviceRegulationandGuidance/PostmarketRequirements/QualitySystemsRegulations/UCM134625.pdf 

Первая ссылка - это страница, которая в строке 683] ссылается на ваш файл. Обратите внимание, что я не ставил http://раньше.

Не могу заставить это работать .. Но я даже не уверен, что страница существует? поиск сайта FDA дает для * UCM134625.pdf * дает только один результат, и это для файла. http://google2.fda.gov/search?q=UCM134625.pdf&client=FDAgov&site=FDAgov&lr=&proxystylesheet=FDAgov&requiredfields=-archive%3AYes&output=xml_no_dtd&getfields=* Norfeldt 8 лет назад 0
@Norfeldt Обновленный ответ. Обратите внимание, что я добавил пробел, даже если это было сказано, чтобы избежать его (__! __). В общем, вы можете легко обнаружить, что несколько страниц связаны с одним файлом. Или то, что страница, на которую он был связан однажды, больше не существует, но файл все еще доступен ... если вы не можете найти страницу (поиск также в истории вашего браузера), вы можете попытаться найти кешированный файл. копия ... Hastur 8 лет назад 0
Оператор `link:` больше не поддерживается Google. Текст в вашем запросе буквально интерпретируется как `ссылка www.fda.gov / downloads / MedicalDevices / DeviceRegulationandGuidance / PostmarketRequirements / QualitySystemsRegulations / UCM134625.pdf` James P 8 лет назад 0
@James Вы, вероятно, правы, даже если на [этой странице справки] (https://support.google.com/webmasters/answer/55281?hl=en) по-прежнему сообщается в качестве примера ... Кстати, он дает хотя бы одну страницу который содержит ссылку. Просто для заметки, когда я делаю исследование с или без `:`, это дает мне немного другой результат (188 по сравнению с 196 ссылками). Если я использую `href` (вместо` link`), это уменьшает количество найденных записей. Hastur 8 лет назад 0
Огромное спасибо за помощь! Я считаю, что моя проблема могла быть вызвана `http`, который я забыл удалить перед поиском. Norfeldt 8 лет назад 0

Похожие вопросы