Знаете ли вы хорошее программное обеспечение для загрузки всех PDF-ссылок на веб-странице?
Операционная система Windows 7.
Знаете ли вы хорошее программное обеспечение для загрузки всех PDF-ссылок на веб-странице?
Операционная система Windows 7.
Вы можете использовать wget и запустить такую команду:
wget --recursive --level=1 --no-directories --no-host-directories --accept pdf http://example.com
Или с короткими вариантами:
wget -r -l 1 -nd -nH -A pdf http://example.com
ОБНОВЛЕНИЕ: Поскольку в вашем обновлении говорится, что вы работаете в Windows 7: используйте wget для Windows из cmd
строки.
ОБНОВЛЕНИЕ 2: Для графического решения - хотя это может быть излишним, так как он получает другие файлы, тоже DownThemAll
В вашем браузере нажмите CTRL+SHIFT+J и введите
var pdflinks = []; Array.prototype.map. call(document.querySelectorAll("a [href $ =\". pdf\"]"), функция (e, i){if ((pdflinks || []). indexOf (e.href)== - 1){pdflinks.push (e.href);}}); console.log (pdflinks.join (""));
Это вернется в консоли:
" https://superuser.com/questions/tagged/somepdf1.pdf " " https://superuser.com/questions/tagged/somepdf2.pdf " " https://superuser.com/questions/tagged/somepdf3.pdf "
Теперь используя wget
с параметрами командной строки wget url1 url2 ...
Скопируйте и вставьте это, откройте консоль, введите wget
нажмите правую кнопку мыши, чтобы вставить содержимое буфера обмена, и нажмите Enter.
Чтобы использовать загружаемый файл, объедините строки с \n и используйте следующий параметр: wget -i mydownload.txt
Обратите внимание, что большинство других (GUI) программ загрузки тоже допускают вызов через разделенный пробелами список URL.
Надеюсь это поможет. Вот как я обычно это делаю. Это быстрее и гибче, чем любое расширение с графическим интерфейсом, я должен учиться и быть знакомым с.
Если вы хотите остаться в браузере, я написал веб-расширение именно для этой цели - я работаю над добавлением возможности сохранять научные статьи в формате PDF с правильно отформатированными заголовками, но если вы просто хотите загрузить их все, то это прекрасно за это.
Это называется Tab Save и в интернет-магазине Chrome здесь. Вам даже не нужно вводить список URL-адресов, если вы просто открываете их все во вкладках (но для большого количества файлов это может замедлить работу компьютера, поэтому я добавил опцию добавления ваших собственных).
В Google Chrome можно использовать такие расширения, как:
С этим расширением вы можете загружать все изображения, видео, PDF, документы и любые другие файлы, ссылки на которые вы посещаете.
Я недавно использовал uGet (для Windows) для этого. Он имеет графический интерфейс, и вы можете фильтровать файлы, которые вы собираетесь загружать.
Спасает, пытаясь запомнить все эти
Существует несколько инструментов Python, которые позволяют загружать ссылки PDF с веб-сайта на основе результатов поиска Google.
Например
google_dl
(рекомендуется).
Использование:
./google_dl -s http://www.example.com/ -f pdf ""
gsrchDwn
(на основе скрипта нео).
Использование:
./gsrchDwn.py --query "site:http://www.example.com/" --ftype pdf
Примечание: я поддерживаю оба упомянутых скрипта.
Оба они реализуют библиотеку xgoogle
Python. Мой форк этой библиотеки основан на версии pkrumins/xgoogle
.
Связанный: веб-поиск из командной строки Linux.