1

Я скачал дамп сайта с помощью Wget (ссылки конвертированы), и многие файлы имеют такие имена: index.html?foo=bar . Единственный способ открыть их - напрямую указать их в качестве аргументов браузера. Когда я пытаюсь открыть их по ссылке в другом файле, файл открывается просто как index.html . Я пробовал это с Firefox, Chromium, Elinks и Lynx. Lynx - единственный, который работает правильно, но я не всегда могу его использовать, потому что у него есть определенные проблемы . Единственное решение, которое я могу придумать, - переименовать все файлы и преобразовать все ссылки в них, но это не выглядит удобным.

Что я могу сделать, чтобы браузеры (предпочтительно Firefox) открывали эти файлы по ссылкам?

UPD: проблема сохраняется только тогда, когда я пытаюсь открыть файл по ссылке в другом файле или открыть его из адресной строки. Так браузеры ведут себя как часть после ? не является частью имени, но некоторые данные для сервера. Может быть, есть опция экранирования этих символов по умолчанию и буквального перехода по ссылкам?

1 ответ1

0

Выглядит так, как будто сайт, который вы зеркалировали, обрабатывает .html особым образом. Обычно это статический HTML без каких-либо сценариев на стороне сервера, который просто передается веб-сервером на диск.

?foo=bar не действует в статическом HTML. Если это работает на действующем веб-сайте, можно предположить, что файлы .html на этом сервере фактически обрабатываются обработчиком сценариев.

Это приводит к тому, что вы получаете обработанный вывод скрипта, используя wget вместо скрипта, который генерировал вывод. Поскольку у вас нет реального сценария, выходные данные могут отличаться, если выходные данные сценариев отличаются в зависимости от аргументов.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .