doc88.com использует какое-то шифрование для защиты PDF-файлов. Я использовал инструменты разработчика Chrome и обнаружил, что он загружает файл .ebt. Я думаю, что это зашифрованный файл Pdf / Swf.

Я нашел следующий ответ здесь, но я все еще не могу загрузить файл PDF. Кто-нибудь может помочь?

Хорошо. Шифрование, которое использует docin.com, мне абсолютно неизвестно, но я решил, что doc88.com, вероятно, использует программное обеспечение от cryptbot.com, из-за того, что мне не удалось извлечь ключ: он, вероятно, скрыт глубоко во Flash Viewer. - Уайткварк

2 ответа2

0

Попробуйте https://www.npmjs.com/package/doc88-download. Сохраняет PNG каждой страницы, которую затем можно преобразовать в PDF или другой формат в качестве отдельного шага.

0

Вот как получить PDF-файл с www.doc88.com:

  1. Перейдите на веб-сайт интересующего вас документа и загрузите каждую страницу документа, который вы хотите извлечь , наведя на них курсор в течение нескольких секунд (чтобы сделать это быстрее, уменьшите масштаб). Это сохранит PDF в кеше Chrome. По умолчанию не все страницы загружаются в первую очередь.

  2. Щелкните правой кнопкой мыши в любом месте экрана и выберите «Печать ...».

  3. Распечатать в PDF.

  4. Используйте инструмент, чтобы обрезать части страницы, которые не принадлежат к PDF. Например, в Linux вы можете использовать pdfjam. Больше примеров здесь.

  5. Используйте программу OCR, чтобы преобразовать изображение в текст. Качество не гарантировано. Некоторые утилиты для Linux здесь.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .