Файл robots.txt
исключает префиксы каталогов. Например, если у вас есть файл robots.txt
исключающий каталог /foo
, то /foo/bar.html
не должен сканироваться.
Для любого URL, который вы хотите сканировать, вы должны проверить, совпадает ли его путь с одной из директив в файле роботов.
См. Документацию Google для получения дополнительной информации и примеров:
Значение пути используется в качестве основы для определения того, применяется ли правило к определенному URL-адресу сайта. За исключением подстановочных знаков, путь используется для соответствия началу URL-адреса (и любых допустимых URL-адресов, начинающихся с того же пути).
Обратите внимание, что URL-адреса не обязательно должны указывать фактические каталоги на сервере. /download.php?what=thestuff
может быть функционально эквивалентен /download/thestuff
и указывать на тот же ресурс.