Как найти все сайты, соответствующие шаблону website.edu/~ <some_string>?

Question

Лекторы университетов часто имеют свои собственные веб-страницы в университетской области и обмениваются ресурсами там. Если профессора зовут Джон Смит, то его веб-сайт может быть harvard.edu/~jsmith.

Я хочу найти все такие страницы на данном веб-сайте, т.е. все страницы, которые выглядят как website.edu/~[some_string] - обратите внимание на тильду. Причина в том, что я ищу некоторые ресурсы, которые, как я знаю, есть, но я не знаю имени человека, который поделился им.

Я уже попробовал:

Поиск Гугл. Не очень эффективно, так как однажды я случайно наткнулся на что-то, что искал, но это было по гиперссылке на другой веб-странице в этом домене, и Google не возвращал это, когда я искал это до этого - возможно, это вообще не проиндексировано, не уверен об этом.
Используя сайт модификатора поиска Google:«websitename.edu/~», но это не сработало - я ожидал этого, так как этот модификатор принимает только точку в качестве разделителя.

Теоретически, я предполагаю, что можно было бы попытаться получить доступ ко всем возможным веб-сайтам в форме website.edu/~[string], где [string] - некоторая последовательность символов, и попробовать все возможности вплоть до некоторого ограничения на количество символов, и сохранить эти ссылки. которые не возвращают сообщение об ошибке. Но должен быть какой-то более простой способ.

Есть ли у вас какие-либо идеи?

score 1 · Accepted Answer · 2011-03-09T19:38:42

Если вы используете Google, это на самом деле довольно просто:

site:http://www.cameron.edu/~

... например, перечисляет различные страницы профессора. (В ответ на отредактированный вопрос >>>) Примечание: в строке поиска нет кавычек ("").

8mm site:http://www.cameron.edu/~

... показывает профессоров, заинтересованных в 8-мм пленке, в данном случае, доктор Мэтт Дженкинс

Повеселись! 8-)

Сейчас выбран русский

Как найти все сайты, соответствующие шаблону website.edu/~ <some_string>?

1 ответ1

Всё ещё ищете ответ? Посмотрите другие вопросы с метками search website domain search-engines parsing.

Как найти все сайты, соответствующие шаблону website.edu/~ <some_string>?

1 ответ1

Всё ещё ищете ответ? Посмотрите другие вопросы с метками search website domain search-engines parsing.

Похожие