1

Лекторы университетов часто имеют свои собственные веб-страницы в университетской области и обмениваются ресурсами там. Если профессора зовут Джон Смит, то его веб-сайт может быть harvard.edu/~jsmith.

Я хочу найти все такие страницы на данном веб-сайте, т.е. все страницы, которые выглядят как website.edu/~[some_string] - обратите внимание на тильду. Причина в том, что я ищу некоторые ресурсы, которые, как я знаю, есть, но я не знаю имени человека, который поделился им.

Я уже попробовал:

  1. Поиск Гугл. Не очень эффективно, так как однажды я случайно наткнулся на что-то, что искал, но это было по гиперссылке на другой веб-странице в этом домене, и Google не возвращал это, когда я искал это до этого - возможно, это вообще не проиндексировано, не уверен об этом.

  2. Используя сайт модификатора поиска Google:«websitename.edu/~», но это не сработало - я ожидал этого, так как этот модификатор принимает только точку в качестве разделителя.

Теоретически, я предполагаю, что можно было бы попытаться получить доступ ко всем возможным веб-сайтам в форме website.edu/~[string], где [string] - некоторая последовательность символов, и попробовать все возможности вплоть до некоторого ограничения на количество символов, и сохранить эти ссылки. которые не возвращают сообщение об ошибке. Но должен быть какой-то более простой способ.

Есть ли у вас какие-либо идеи?

1 ответ1

1

Если вы используете Google, это на самом деле довольно просто:

site:http://www.cameron.edu/~

... например, перечисляет различные страницы профессора. (В ответ на отредактированный вопрос >>>) Примечание: в строке поиска нет кавычек ("").

8mm site:http://www.cameron.edu/~

... показывает профессоров, заинтересованных в 8-мм пленке, в данном случае, доктор Мэтт Дженкинс

Повеселись! 8-)

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .