Я пытаюсь загрузить документы (pdf, tiff, images) с веб-страниц, на которых есть javascript и фреймы. пример: http://127.0.0.1/web/guest/en/websys/webArch/mainFrame.cgi

'httrack --get-files' не загружал ни одного, есть ли другие способы, о которых вы можете подумать? другая программа? я должен буду написать эту программу сам?

Большое спасибо!

1 ответ1

0

Поскольку этот URL оканчивается на "cgi", я бы предположил, что на сервере выполняется сценарий CGI - это означает, что он, вероятно, ожидает другие данные. Есть несколько вариантов, где можно получить эти данные

Во-первых, эти другие данные могут поступить из вашего сеанса. Посмотрите на документы для wget для --load-cookies чтобы указать, что он должен использовать файл cookie из вашего браузера (инструкции на моем компьютере относятся к старым форматам файлов cookie браузера).

Другой вариант заключается в том, что он ожидает данные POST от вашего браузера. Вам нужно выяснить, что такое переменные и значения формы, и передать их, используя параметры --post-data или --post-file .

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .