22

Знаете ли вы хорошее программное обеспечение для загрузки всех PDF-ссылок на веб-странице?

Операционная система Windows 7.

6 ответов6

34

Вы можете использовать wget и запустить такую команду:

wget --recursive --level=1 --no-directories --no-host-directories --accept pdf http://example.com

Или с короткими вариантами:

wget -r -l 1 -nd -nH -A pdf http://example.com

ОБНОВЛЕНИЕ: Поскольку в вашем обновлении говорится, что вы работаете в Windows 7: используйте wget для Windows из cmd строки.

ОБНОВЛЕНИЕ 2: Для графического решения - хотя это может быть излишним, так как он получает другие файлы, тоже DownThemAll

6
  1. В вашем браузере нажмите CTRL+SHIFT+J и введите

    var pdflinks = []; Array.prototype.map. call(document.querySelectorAll("a [href $ =\". pdf\"]"), функция (e, i){if ((pdflinks || []). indexOf (e.href)== - 1){pdflinks.push (e.href);}}); console.log (pdflinks.join (""));

    Это вернется в консоли:

    " https://superuser.com/questions/tagged/somepdf1.pdf " " https://superuser.com/questions/tagged/somepdf2.pdf " " https://superuser.com/questions/tagged/somepdf3.pdf "

  2. Теперь используя wget с параметрами командной строки wget url1 url2 ...

Скопируйте и вставьте это, откройте консоль, введите wget нажмите правую кнопку мыши, чтобы вставить содержимое буфера обмена, и нажмите Enter.

Чтобы использовать загружаемый файл, объедините строки с \n и используйте следующий параметр: wget -i mydownload.txt

Обратите внимание, что большинство других (GUI) программ загрузки тоже допускают вызов через разделенный пробелами список URL.

Надеюсь это поможет. Вот как я обычно это делаю. Это быстрее и гибче, чем любое расширение с графическим интерфейсом, я должен учиться и быть знакомым с.

1

Если вы хотите остаться в браузере, я написал веб-расширение именно для этой цели - я работаю над добавлением возможности сохранять научные статьи в формате PDF с правильно отформатированными заголовками, но если вы просто хотите загрузить их все, то это прекрасно за это.

Это называется Tab Save и в интернет-магазине Chrome здесь. Вам даже не нужно вводить список URL-адресов, если вы просто открываете их все во вкладках (но для большого количества файлов это может замедлить работу компьютера, поэтому я добавил опцию добавления ваших собственных).

0

В Google Chrome можно использовать такие расширения, как:

  • Скачать Мастер

    С этим расширением вы можете загружать все изображения, видео, PDF, документы и любые другие файлы, ссылки на которые вы посещаете.

0

Я недавно использовал uGet (для Windows) для этого. Он имеет графический интерфейс, и вы можете фильтровать файлы, которые вы собираетесь загружать.

Спасает, пытаясь запомнить все эти

0

Google

Существует несколько инструментов Python, которые позволяют загружать ссылки PDF с веб-сайта на основе результатов поиска Google.

Например

  • google_dl (рекомендуется).

    Использование:

    ./google_dl -s http://www.example.com/ -f pdf ""
    
  • gsrchDwn (на основе скрипта нео).

    Использование:

    ./gsrchDwn.py --query "site:http://www.example.com/" --ftype pdf
    

Примечание: я поддерживаю оба упомянутых скрипта.

Оба они реализуют библиотеку xgoogle Python. Мой форк этой библиотеки основан на версии pkrumins/xgoogle.


Связанный: веб-поиск из командной строки Linux.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .